自然言語処理チャンキング読み方: チャンキングチャンキング とはRAGシステムにおいて、ドキュメントを適切なサイズの断片(チャンク)に分割する前処理技術。固定長分割・段落単位分割・意味的分割(Semantic Chunking)などの手法がある。チャンクサイズが大きすぎると検索精度が低下し、小さすぎると文脈が失われるトレードオフがある。関連用語RAG(検索拡張生成)自然言語処理埋め込みベクトル(Embedding)自然言語処理ベクトルデータベース自然言語処理意味検索開発自然言語処理の他の用語LLM(大規模言語モデル)自然言語処理(NLP)トランスフォーマーGPTBERTプロンプトエンジニアリング用語集一覧に戻る