自然言語処理

トークナイズ

読み方: トークナイズ

トークナイズ とは

テキストをモデルが処理できる最小単位(トークン)に分割する前処理。英語は単語・サブワード単位、日本語は文字・形態素単位が多い。BPE(Byte Pair Encoding)・SentencePieceなどのアルゴリズムが使われる。LLMのAPIコスト計算の基本単位でもあり、入出力トークン数が課金に直結する。
用語集一覧に戻る

無料診断

あなたに合ったAIツールを今すぐ見つけよう

1,200以上のAIツールから、課題・業界・予算で絞り込み。資料請求不要。

AIツール診断をはじめる