自然言語処理

チャンキング

読み方: チャンキング

チャンキング とは

RAGシステムにおいて、ドキュメントを適切なサイズの断片(チャンク)に分割する前処理技術。固定長分割・段落単位分割・意味的分割(Semantic Chunking)などの手法がある。チャンクサイズが大きすぎると検索精度が低下し、小さすぎると文脈が失われるトレードオフがある。
用語集一覧に戻る