AI基礎AIベンチマーク読み方: エーアイベンチマークAIベンチマーク とはAIモデルの性能を標準化された課題・データセットで評価する仕組み。MMLU(一般知識)・HumanEval(コード生成)・GSM8K(数学)・MT-Bench(対話品質)などが代表的。モデル選定の客観指標となるが、ベンチマーク最適化と実用性の乖離(Goodhartの法則)も指摘されている。関連用語LLM(大規模言語モデル)自然言語処理機械学習機械学習オープンソースAI開発AIベンチマークに関連するAIツールAI BrowserAI Browserの公式サイトが見つかりませんでした。提供されたURLは404エラーを返しました。そのため、AI Br...YOMELYOMELはPKSHA提供のAI会議議事録自動化ツール。Teams、Zoom対応。日本語音声認識に特化し、月20万会議以...Asana IntelligenceAsana Intelligenceは、AIを活用してチームの作業効率を向上させるツールです。タスクの優先順位付け、プロ...AWS AI サービスAWS AI Servicesは、機械学習の専門知識がなくても、インテリジェントなアプリケーションを構築できるAIサービ...AI基礎の他の用語生成AI人工知能(AI)汎用人工知能(AGI)マルチエージェント自律型AIConstitutional AI(憲法AI)用語集一覧に戻る