Windows向けの優れた音声合成ソリューション[終了]


9

私はWindows 7を実行していますが、アプリケーションでテキストを読み取る機能があることはわかっていますが、テキストのチャンクをwavファイルまたはmp3として保存するための優れたユーティリティを探しています。すでにOSに組み込まれている可能性がありますが、巧妙に偽装されています。APIを呼び出すプログラム作成できることはわかっています。これは、適切な解決策がまだない場合の次のステップです。

私はAT&Tシステムの品質が本当に好きですが、作成されたMP3の使用にはかなり厳しい制限があります。ポッドキャストで使用したいのですが。

Webベースでも問題ありません(パブリックドメインまたはクリエイティブコモンズ)のWav、MP3、またはその他の標準的なオーディオファイルを簡単に作成できる限り。当然、私はコマーシャルよりもフリーまたはオープンソースを好みますが、それは要件ではありません。

回答:


4

私は、epeakfestivalMaryTTSを試しました。それらはすべて大部分が理解できる声を生成しますが、それらは非常に自然ではありません。これらのシステム(Mbrola、CMU Arcticなど)の追加の音声ダウンロードを使用しても、音声はそれほど大きくありません。

IVONAの声は今まで聞いた中で最高です。30日間無料のデモが提供されるので、1回限りのタスクを実行する場合に十分です。その後、彼らは45ドル/声のようなものです。Amazonが会社を買収したばかりなので、しっかりしていることがわかります(http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/)。

それらはMicrosoftのSAPIインターフェースで動作します。つまり、音声はそれをサポートするすべてのプログラム(Adobe Readerなど)で利用できます。テキストファイルをWaveファイルに一括変換するのに便利なText To Wavプログラムで使用しています。

編集する

実際、あなたの質問をもう一度読んでください。私が非個人的な使用(例:ポッドキャスト)の場合、IVONAの価格はおそらくはるかに高くなります。その場合は、MaryTTSをチェックしてください。


私はMaryTTSを聴いただけで、それはeSpeakとFestivalのトップを吹き飛ばしました。
2013年

MaryTTSは素晴らしい声を持っています、そしてそれも無料です。
ジムマッキース2013年

デスクトップ用のIvona音声のテキスト読み上げがTextAloud
ユーザー

6

eSpeakは無料でオープンソースであり、必要なすべてを提供します。

コマンドラインプログラムとして実行して、ファイルまたはstdinからテキストを読み上げることができます。
共有ライブラリバージョンも利用できます。

*特性を変更できるさまざまなボイスが含まれています。
*音声出力をWAVファイルとして生成できます。
* SSML(音声合成マークアップ言語)がサポートされています(完全ではありません)。
  また、HTML。
* コンパクトサイズ。多くの言語を含むプログラムとそのデータ、
  合計は約1Mバイトです。
*テキストを音素コードに変換できるため、フロントとして適応できます
  別の音声合成エンジンを終了します。
*他の言語の可能性。いくつかはさまざまな段階に含まれています
  進歩の。これらまたは他の言語のネイティブスピーカーからのヘルプは
  歓迎した。
*音素データの生成と調整に使用できる開発ツール。
* C ++で記述されています。

eSpeakは興味深いように見えますが、「クイックスタート」ガイドから本当に恩恵を受けることができます。先端をありがとう。私はそれで働き続けます。
ジムマッキース

eSpeakの+1。私は長い間これを行うアプリを探していました。ありがとうございます!
Axxmasterr 2009
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.