自然言語処理
音声認識(ASR)
読み方: おんせいにんしき
音声認識(ASR) とは
Automatic Speech Recognitionの略。人間の音声をテキストに変換する技術。WhisperO(OpenAI)・Google Speech-to-Text・Amazon Transcribeが代表的なAPIサービス。議事録自動化・音声コマンド・コールセンター分析などに広く使われ、日本語精度も大幅に向上している。
音声認識(ASR)に関連するAIツール
YOMEL
YOMELはPKSHA提供のAI会議議事録自動化ツール。Teams、Zoom対応。日本語音声認識に特化し、月20万会議以...
Azure AI Speech
Azure AI Speechは、高精度な音声テキスト変換とテキスト音声変換を実現します。カスタマイズ可能な音声モデルを...
Google Cloud Speech-to-Text
Google Cloud Speech-to-Textは、強力なAI技術を使用して、オーディオデータをテキストに変換する...
コトハ
COTOHAは、NTTコミュニケーションズが提供する大規模言語モデルです。日本語に特化した自然言語処理を実現し、企業向け...