アウトプット別AIツール

音声・ナレーションを作れるAIツール一覧【2026年最新】

ナレーション・BGM・音声をAIで生成

9件のツール 最終更新: 2026年4月2日

9件のサービス
ElevenLabs

ElevenLabs

無料

ElevenLabs · アメリカ

世界最高水準の音声合成・音声クローニングAIプラットフォーム。29言語に対応した自然な音声生成と、わずか1分の音声サンプルから本人そっくりの音声クローンを作成できる技術を持つ。ポッドキャスト・有声書籍・ゲームナレーション・多言語コンテンツ制作に広く活用されている。

  • 29言語対応
  • 音声クローン
  • 感情表現
  • 話速調整
無料あり¥500/月〜4プラン
詳細を見る
Filmora AI

Filmora AI

日本語無料

Wondershare · 中国

Filmora AIは、動画編集をより効率的に、そして創造的に行うためのAI搭載ツールです。動画生成から編集、仕上げまで、AIがあなたのアイデアを形にする強力なアシスタントとして機能し、初心者からプロまで幅広いユーザーのニーズに応えます。

  • AI動画生成:テキストやイメージから、高品質な動画を自動生成
  • AIサムネイル:クリック率の高い魅力的なサムネイルを自動作成
  • AI音楽:動画に最適なBGMをAIが自動作曲
  • AIテキストtoビデオ:テキストを入力するだけで、AIが動画を生成
無料あり¥1,200/月〜3プラン
詳細を見る
Harmonai

Harmonai

無料

Harmonai (Stability AI支援) · アメリカ

Stability AIが支援するオープンソースの音楽生成AIプロジェクト。Dance Diffusionモデルで音楽を生成し、研究者やミュージシャンがAI音楽技術を自由に利用・発展させるためのコミュニティ。

  • オープンソース
  • Dance Diffusion
  • 音楽生成AI
  • コミュニティ主導
無料3プラン
詳細を見る
Speechify

Speechify

無料

Speechify · アメリカ

テキストを自然な音声に変換するAI読み上げプラットフォーム。ブラウザ拡張・iOS・Android対応で、PDF、Webページ、電子書籍をどこでも音声で聞ける。OCR機能で印刷物もスキャンして読み上げ可能。30以上の言語に対応。

  • テキスト読み上げ
  • ブラウザ拡張
  • OCR対応
  • 速度調整
無料あり¥1,800/月〜2プラン
詳細を見る
Stability AI

Stability AI

無料

Stability AI · イギリス

Stable Diffusionの開発元。画像・動画・音声・3D・言語の生成AIモデルを開発・公開。オープンソースAIモデルのリーダーとして、Stable Diffusion、Stable Video等を提供。

  • 画像生成AI
  • 動画生成AI
  • API提供
  • オープンソース
無料あり3プラン
詳細を見る
Suno

Suno

無料

Suno · アメリカ

テキストプロンプトから完全な楽曲(ボーカル・歌詞・楽器)を生成するAI音楽生成ツール。クオリティの高い楽曲をわずか数秒で生成でき、CMジングル・BGM・ポップス・クラシックなど多様なジャンルに対応。音楽制作の民主化を推進し、音楽の素人でもプロ品質の楽曲制作が可能になる。

  • 完全楽曲生成
  • ボーカル付き
  • 多ジャンル対応
  • 歌詞生成
無料あり¥1,000/月〜3プラン
詳細を見る
Twilio

Twilio

無料

Twilio · アメリカ

Twilioは、コミュニケーションAPIとAIを組み合わせた顧客エンゲージメントプラットフォームです。SMSやWhatsAppなど、様々なチャネルで優れた顧客体験を構築できます。

  • SMS・音声API
  • 会話フローUI
  • 多チャネル通信
  • WhatsApp連携
無料あり3プラン
詳細を見る
VOICEVOX

VOICEVOX

日本語無料

Hiroshiba · 日本

日本語に特化した無料の音声合成ソフトウェア。ずんだもん・四国めたん・春日部つむぎなど個性豊かなキャラクターの音声で、自然な日本語音声を生成できる。YouTuber・VTuber・ゲーム開発者・教育コンテンツ制作者に広く使われており、APIも無料で提供されている。

  • 日本語特化
  • 複数キャラクター
  • 感情表現
  • 無料API
無料1プラン
詳細を見る
Vrew

Vrew

日本語無料

Vrew · 韓国

AIを活用した動画編集ソフト。音声認識による自動字幕生成・テキストベースの動画編集・AI音声生成など、動画制作の工数を大幅に削減する機能を搭載。日本語対応が充実しており、YouTuberやビジネス動画制作者を中心に国内での利用が急増している。

  • 自動字幕生成
  • テキストベース編集
  • AI音声
  • 多言語翻訳
無料あり¥990/月〜3プラン
詳細を見る