画像認識

マルチモーダルAI

読み方: マルチモーダルエーアイ

マルチモーダルAI とは

テキスト・画像・音声・動画など複数のモダリティを統合処理するAIモデル。GPT-4V・Gemini Ultra・Claude 3などが代表例。「この画像について説明して」「グラフを分析して」など視覚と言語を組み合わせたタスクをこなせる。AIの実用性を大幅に拡張する次世代技術。
用語集一覧に戻る

無料診断

あなたに合ったAIツールを今すぐ見つけよう

1,200以上のAIツールから、課題・業界・予算で絞り込み。資料請求不要。

AIツール診断をはじめる