音声認識-MP3からテキストソフトウェア[終了]


16

スピーチ録音(特にポッドキャスト)を含むMP3ファイルをテキストに転写できるスピーカー非依存プログラム(商用または無料)を探しています。私はDragon Naturally Speakingを試してみたかったのですが、自分の音声録音の書き起こししかサポートしていないようです。それでは、代替手段は何ですか?


アビのコメント:私はそれが可能だとは思わない-スピーカーの独立を
イヴォFlipse

どのオペレーティングシステム?
studiohack

WindowsまたはLinux。
パコ

回答:


7

Dragon Naturally Speakingはmp3ファイルをインポートし、文字起こしを試みます。音声認識を個々のスピーカーに合わせて調整することを好みますが、調整せずに公正な仕事をします。あなたのポッドキャストスピーカーがTom Brokawのように聞こえる場合、おそらく最適に動作します。


2
Dragon Naturally Speakingを試してみましたが、未知のスピーカーとのポッドキャストではひどい仕事をしました。プログラムをトレーニングした後、自分の声でしかうまく機能しませんでした。
パコ

1
他のオーディオファイルをインポートして文字起こしすることもできますか?
ラリーモリーズ

4

考えられる解決策の1つは、動画をYoutubeにアップロードし、有効にできる自動キャプションを試すことです...まだ正確ではありませんが、キャプションファイルをダウンロードして自分で編集することができます。曲の著作権/著作権侵害の問題については、可能であれば、プロフィールで動画を非公開にすることもできますか?


1
@studioback:Youtubeによるこの方法は、自分の動画にのみ適用され、他の人がアップロードした動画には適用されませんか?
秒のStackExchange

1
@Tim:実際には両方のためです。
studiohack

1
@studiohack:他の人がアップロードした動画の場合、どうすればいいですか?つまり、自分の動画としてダウンロードしたりアップロードしたりしなくてもいいのですか?
秒のStackExchange

1
上のほとんどの動画、自動転写...そこCCアイコンが底にある、それをクリックして
studiohack


2

Dragon Naturally Speakingを試すことに対して警告します-ジェイルブレイクしたiPhoneで、すべてのボイスメールファイルを電話からPC上のフォルダーにコピー/変換するためのスクリプトを作成し、Dragon Naturally Speakingトランスクリプションサービスをそれらに対して実行しました。

異なるスピーカーのファイルに対して文字起こしを実行した結果は、まったく使用できませんでした。私はいくつかのオープンソースの代替を試しましたが、話者に依存しない音声認識はまだ非常に小さな辞書に限定されているようです。


1

http://www.voicebase.comで英語のポッドキャストとビデオを使用していますが、非常にうまく機能します。50オーディオ時間は無料です。

音声転写は、rtf、srt、またはpdfでダウンロードできます。

機械転写は、アップロードしてから約10〜15分後、場合によっては早期にダウンロードできます。


1

オープンソース:CMU Sphinx

シェアウェア:http : //www.e-speaking.com/(Windows)

コマーシャル:Dragon NaturallySpeaking(Windows)

udaxとsoundflowerを使用して実行できるosx使用している場合は、この方法を試すこともできます。

また、試してみる価値のある別のシェアウェアであるvoxcribeccのオープンソースに関連するリンクを見つけることもできます。

.netプログラマーなら、このメソッドを使用して独自のキットを作成できます


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.