スピーチ(mp3オーディオファイル)をテキストに変換する


8

mp3からtxtへのシンプルなコンバーターを探しています。試してみましたが、成功しませんでした。julius、CMU Sphinx、...過去4時間で、それらを使用する方法(または適切にインストールする方法)が見つかりませんでした。

私が探しているのは次のようなものです:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

変換するファイルが少なく、クリックするだけなので、GUIアプリケーションにも問題はありません。

編集:この回答を利用して、音声認識アプリでMP3をテキストに変換しますか?私はそれを動作させるように管理しましたが、出力を生成しません。ええと、実際には数行の空白行が生成されます(単語は検出されません)...


実行する正確なコマンドと表示される出力は何ですか?
Nikolay Shmyrev 2016年

1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null&> otput.txtは、正確なコマンドです@NikolayShmyrevの質問。sourceforge.net/projects/cmusphinx/files/…からモデルをダウンロードしました。
サモ

回答:


4

pocketsphinxは、既存のオーディオファイルからテキストを音声に変換します。mp3の初期フォーマットによっては、2つの個別のコマンドが必要になる場合があります。

まず、既存のオーディオファイルを必須の入力形式に変換します。

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

ランポケットスフィンクス

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

作成されたファイルmyspeech.txtには、探しているものが含まれています。


ubuntuを初めて使用する場合は、次のコマンドを使用して上記のプログラムをインストールする必要があります。

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg

0

Mozilla SpeechDeepオープンソースの音声テキスト変換ツールで実行できます。アプリケーションをLinuxデスクトップにインストールする必要があります。または、インストールが不要なブラウザベースの音声文字変換ツールであるTranscribearを試すこともできますが、サーバーに録音をアップロードするには、オンラインに接続する必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.