画像認識

マルチモーダルAI

読み方: マルチモーダルエーアイ

マルチモーダルAI とは

テキスト・画像・音声・動画など複数のモダリティを統合処理するAIモデル。GPT-4V・Gemini Ultra・Claude 3などが代表例。「この画像について説明して」「グラフを分析して」など視覚と言語を組み合わせたタスクをこなせる。AIの実用性を大幅に拡張する次世代技術。

Google Gemini API

Google AIのGeminiモデルをAPI経由で利用。Gemini Pro/Ultra/Flashの各モデルで文章生...

AI Browser

AI Browserの公式サイトが見つかりませんでした。提供されたURLは404エラーを返しました。そのため、AI Br...

YOMEL

YOMELはPKSHA提供のAI会議議事録自動化ツール。Teams、Zoom対応。日本語音声認識に特化し、月20万会議以...

Asana Intelligence

Asana Intelligenceは、AIを活用してチームの作業効率を向上させるツールです。タスクの優先順位付け、プロ...