回答:
使用できるソフトウェアはCMUSphinxです。別の回答で提案されているとは異なり、Juliusはモデルを必要とするため適切ではありません。Juliusでは、大規模な語彙音声認識のモデルは利用できません。
pocketsphinxを使用して、オーディオファイルを変換できます。これらの2つのコマンドで作業を行う必要があります。最初にファイルを必要な形式に変換してから、それを認識します。
ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
ランポケットスフィンクス
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt
結果はresult.txtに保存されます。
pocketsphinx_continuous -infile file.wav -hmm en_US/hub4wsj_sc_8k -lm en_US/hub4.5000.DMP 2> pocketsphinx.log
働いた。最適なパッケージではないかもしれませんが、リポジトリで見つけることができる最適なパッケージでした。
私はこれが古いことを知っていますが、Nikolayの答えを拡張し、将来誰かを救うことを願っています、最新バージョンのpocketsphinxを動作させるには、githubまたはsourceforgeリポジトリからコンパイルする必要があります(わからないより最新の状態に保たれます)。-j8は、可能であれば8つの独立したジョブを並行して実行することを意味します。より多くのCPUコアがある場合は、数を増やすことができます。
git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
その後、から:https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/は、
最新バージョンをダウンロードcmusphinx-en-us-....tar.gz
し、en-70k-....lm.gz
tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz
その後、最終的にニコライの答えから手順を進めることができます:
ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
-hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
2>pocketsphinx.log >book.txt
スフィンクスは大丈夫です。読みやすいバージョンのテキストを作成するためにこれに依存するつもりはありませんが、特定の引用を探している場合は検索できるので十分です。Xapian(http://www.lesbonscomptes.com/recoll/)などのワイルドカードを受け入れ、正確な検索式を必要としない検索アルゴリズムを使用する場合、特にうまく機能します。
お役に立てれば。
pocketsphinx_continuous: error while loading shared libraries: libpocketsphinx.so.3: cannot open shared object file: No such file or directory
-------> export LD_LIBRARY_PATH=/usr/local/lib
------->export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
音声をテキストに変換したいのですが、Ubuntu Software Centerを開いてJuliusを検索してみてください
説明
「Julius」は、音声関連の研究者および開発者向けの高性能な2パス大語彙連続音声認識(LVCSR)デコーダーソフトウェアです。
または、ソフトウェアセンターにない別のオプションはSimonです
...は、オープンソースの音声認識プログラムで、マウスとキーボードを置き換えます。
参照リンク
http://julius.sourceforge.jp/en_index.php
speechpad.pw転写パネルを使用できます