機械学習

量子化

読み方: りょうしか

量子化 とは

AIモデルのパラメータ精度をFP32(32bit)からFP16・INT8・INT4などの低ビットに変換し、メモリ使用量と推論速度を改善する技術。GPTQ・AWQ・GGUF(llama.cpp)などの手法があり、精度低下を最小限に抑えつつモデルサイズを1/4以下に圧縮できる。個人PCでのLLM実行を可能にした重要技術。
用語集一覧に戻る

無料診断

あなたに合ったAIツールを今すぐ見つけよう

1,200以上のAIツールから、課題・業界・予算で絞り込み。資料請求不要。

AIツール診断をはじめる