自然言語処理

音声認識（ASR）

読み方: おんせいにんしき

音声認識（ASR）とは

Automatic Speech Recognitionの略。人間の音声をテキストに変換する技術。WhisperO（OpenAI）・Google Speech-to-Text・Amazon Transcribeが代表的なAPIサービス。議事録自動化・音声コマンド・コールセンター分析などに広く使われ、日本語精度も大幅に向上している。

音声認識（ASR）に関連するAIツール

YOMEL

YOMELはPKSHA提供のAI会議議事録自動化ツール。Teams、Zoom対応。日本語音声認識に特化し、月20万会議以...

Azure AI Speech

Azure AI Speechは、高精度な音声テキスト変換とテキスト音声変換を実現します。カスタマイズ可能な音声モデルを...

Google Cloud Speech-to-Text

Google Cloud Speech-to-Textは、強力なAI技術を使用して、オーディオデータをテキストに変換する...

コトハ

COTOHAは、NTTコミュニケーションズが提供する大規模言語モデルです。日本語に特化した自然言語処理を実現し、企業向け...

自然言語処理の他の用語

LLM（大規模言語モデル）自然言語処理（NLP）トランスフォーマー GPT BERT プロンプトエンジニアリング

用語集一覧に戻る

音声認識（ASR）

音声認識（ASR） とは

関連用語

音声認識（ASR）に関連するAIツール

自然言語処理の他の用語

音声認識（ASR）とは