自然言語処理

音声認識(ASR)

読み方: おんせいにんしき

音声認識(ASR) とは

Automatic Speech Recognitionの略。人間の音声をテキストに変換する技術。WhisperO(OpenAI)・Google Speech-to-Text・Amazon Transcribeが代表的なAPIサービス。議事録自動化・音声コマンド・コールセンター分析などに広く使われ、日本語精度も大幅に向上している。
用語集一覧に戻る