画像認識マルチモーダルAI読み方: マルチモーダルエーアイマルチモーダルAI とはテキスト・画像・音声・動画など複数のモダリティを統合処理するAIモデル。GPT-4V・Gemini Ultra・Claude 3などが代表例。「この画像について説明して」「グラフを分析して」など視覚と言語を組み合わせたタスクをこなせる。AIの実用性を大幅に拡張する次世代技術。関連用語LLM(大規模言語モデル)自然言語処理画像認識画像認識生成AIAI基礎ViT(Vision Transformer)画像認識マルチモーダルAIに関連するAIツールChatGPTOpenAIが開発した世界最大規模の対話型AIアシスタント。文章作成、翻訳、要約、コーディング、アイデア出しなど幅広いタ...Asana Intelligenceプロジェクト管理ツールAsanaのAI機能。プロジェクトの目標設定、タスク優先度付け、ステータス報告をAIが自動生成。チ...Monday.com AIワークマネジメントプラットフォームMonday.comのAI機能。タスクの自動生成、メール下書き、数式生成、テキスト要約...Figma AIデザインツールFigmaに統合されたAI機能。テキストプロンプトからUIデザインを生成、レイヤー名の自動リネーム、画像背...画像認識の他の用語画像認識CNN(畳み込みニューラルネットワーク)ViT(Vision Transformer)物体検出AI画像生成拡散モデル(Diffusion Model)用語集一覧に戻る