AI基礎AIベンチマーク読み方: エーアイベンチマークAIベンチマーク とはAIモデルの性能を標準化された課題・データセットで評価する仕組み。MMLU(一般知識)・HumanEval(コード生成)・GSM8K(数学)・MT-Bench(対話品質)などが代表的。モデル選定の客観指標となるが、ベンチマーク最適化と実用性の乖離(Goodhartの法則)も指摘されている。関連用語LLM(大規模言語モデル)自然言語処理機械学習機械学習オープンソースAI開発AIベンチマークに関連するAIツールChatGPTOpenAIが開発した世界最大規模の対話型AIアシスタント。文章作成、翻訳、要約、コーディング、アイデア出しなど幅広いタ...ClaudeAnthropicが開発した安全性重視の高性能AIアシスタント。200Kトークンの超長文コンテキストウィンドウを持ち、長...GitHub CopilotGitHubとOpenAIが共同開発した世界最大規模のAIコーディングアシスタント。VS Code・JetBrains・...CursorAIファーストのコードエディター。VSCodeをベースに構築され、コードベース全体を理解した上でのAI補完・チャット・イ...AI基礎の他の用語生成AI人工知能(AI)汎用人工知能(AGI)マルチエージェント自律型AIConstitutional AI(憲法AI)用語集一覧に戻る