機械学習

合成データ

読み方: ごうせいデータ

合成データ とは

AIモデルによって人工的に生成された学習用データ。実データの不足・プライバシー制約・ラベル付けコストの問題を解決する手法として注目される。LLMによるテキスト生成、画像生成モデルによる学習データ拡張、シミュレーション環境からのデータ生成などが含まれる。データ品質の検証が課題。
用語集一覧に戻る