コンピュータユーザー speech-recognition

3

バックグラウンドノイズを減らし、ffmpegを使用してオーディオクリップからの音声を最適化する

音声認識のためにビデオファイルからオーディオクリップを抽出します。これらのビデオはモバイル/その他の手作りデバイスからのものであるため、多くのノイズが含まれています。音声のバックグラウンドノイズを減らして、音声認識エンジンに中継する音声が明瞭になるようにします。私はffmpegを使用してこのすべてを行いますが、ノイズ低減フェーズで立ち往生しています。今まで、次のフィルターを試してみました： ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav しかし、結果は非常に残念です。私の理由は、音声が300〜3000 Hzの範囲内にあるため、他のすべての周波数をフィルタリングしてバックグラウンドノイズを抑えることができるからです。私は何が欠けていますか？また、音声の強調に使用できるウィナーフィルターについて読んだところ、これを見つけましたが、その使用方法はわかりません。

30 audio ffmpeg noise voice speech-recognition

6

音声認識-MP3からテキストソフトウェア[終了]

閉まっている。この質問はトピック外です。現在、回答を受け付けていません。この質問を改善したいですか？質問を更新することがありますので、上のトピックスーパーユーザーのために。閉じた3年前。スピーチ録音（特にポッドキャスト）を含むMP3ファイルをテキストに転写できるスピーカー非依存プログラム（商用または無料）を探しています。私はDragon Naturally Speakingを試してみたかったのですが、自分の音声録音の書き起こししかサポートしていないようです。それでは、代替手段は何ですか？

16 mp3 voice speech-recognition speech-to-text

3

YouTubeに動画をアップロードせずにGoogleのYouTube音声認識を使用する方法

字幕が欲しいレクチャービデオコンテンツがたくさんあります。YouTubeは、特定の条件下でビデオの字幕を自動的に生成します（これらの条件は、いまだに謎です）。この音声認識技術をYouTube外で使用できるようにしたいと思います。トランスクリプトを取得するためだけにすべてのビデオをアップロードしたくはありません（時間がかかりすぎます）。さらに、約30分（ほとんどの場合）よりも長いビデオに対してYouTubeがそれを行うとは思いません。非公開のリストに掲載されている動画に対してはそれが行われるとは思わない（これは販売することを意図したプレミアムコンテンツであるため問題です）。完璧なシナリオ：デスクトップから実行してこれらのビデオからトランスクリプトを取得できるプログラムがあり、YouTubeと同等またはそれ以上の品質で、SRTまたはYouTubeが生成するXMLに似たタイムコードを持っています[ How to YouTube字幕を取得する ]。受け入れられるシナリオ：プライベートまたはパブリックに設定されているかどうかにかかわらず、YouTubeに強制的に動画を転記させるためにできるいくつかのトリックがあります。実行可能なシナリオ：自分のプログラムをコーディングするために使用できるライブラリーまたは何かがあります。私はC＃が得意で、C ++でも大丈夫です（しかし、私は本当にC＃が好きです）。

15 video youtube speech-recognition speech-to-text

1

google音声認識オフラインLinux

音声認識の研究をしていると、Android上のGoogle音声認識サービスをダウンロードしてAndroidでオフラインで使用できるという記事をいくつか目にしました。コンピューターでのGoogleスピーチサービスの使用についてもいくつか見ましたが、これにはGoogleサーバーへのクエリが含まれていました。だから私の質問です：コンピューター上でオフラインで、特にLinuxでGoogle音声認識サービスを使用する方法はありますか？

9 linux speech-recognition

2

Windows 8音声認識言語

Windows 8 Proをインストールしました（MSDNのRTMバージョン）。私が使用するアプリケーションでは、音声認識言語を英語-米国に設定する必要があります。私の唯一の選択肢は英語-英国です。コントロールパネルの[言語]に移動して、唯一の言語を英語（米国）に設定しようとしましたが、音声プロパティのオプションは英語（英国）のみです。音声プロパティに言語を追加するにはどうすればよいですか？

9 windows-8 speech-recognition

2

ドラゴンのような音声ディクテーションソフトウェアがスピーカー側からしか動作しないのはなぜですか？

私のラップトップや携帯電話が私の言うことを口述したりタイプしたりするのではなく、反対側の相手の言葉を書いてください。 GoogleやNuanceがその機能を有効にしないのはなぜですか？それも可能ですか？それが機能するために何が必要でしょうか？

4 audio speech-recognition dragon-naturally-speaking

2

Windows音声認識の精度を改善するにはどうすればよいですか？

なぜWindows Speech RecognitionWindowsの8と8.1で（アプリ）はとても哀れな？彼らが何年も前にOSに最初に搭載して以来、私はそれを使用してきましたが、ほとんど改善されていません。まだ最も基本的なことを理解するのに苦労しています。そして、これがハードウェアの議論になってほしくありません。私のハードウェアは問題なく、安いジャンク品と本当に高価なハードウェアを試しました。ヘッドフォン（マイク付き）を試し、デスクマイクを試しました。今では、新しいPCにすべて組み込まれたマイクを使用しています。これまでのところ、これはこれまでで最高のマイクです。それでも、Windows音声認識はどのタスクにもほとんど役に立たない。私はスピーチが難しいことを知っています。しかし、私は彼らがこれよりもはるかに良くできることも知っています。私がこれを知っているのは、（最も安価なモデルの1つである）HTC 8S（Windows Phone）を所有しており、これまでの人生で最高の評価を得ているからです。私の言うことをほぼ常に理解しています-100％の時間。私が理解していないのは、なぜ彼らは彼らの製品を死なせるのではなく、変化のために彼らの脳を使うことができないのかということです。なぜ彼らは自分の携帯電話ですばらしいスピーチ認識を持ち、この技術をPCのWindows OSに組み込む方法を見つけることができないのでしょうか？そして、万が一、電話のPCで同じものを使用している場合、完全に******であるため、変更を加えたに違いありません。そのため、Windows音声認識アプリの更新プログラムまたは新しいバージョンを探していましたが、見つけることができませんでした。このことの精度を劇的に改善する方法はありますか？

2 windows-7 windows-8 audio microphone speech-recognition

2

Windows XPでのマイクのセットアップ

Windows XPでは、音声コントロールパネルで、マイクが接続されていない場合（このような場合の音声入力はThinkpad T400を使用しています）、マイクを接続すると、コンピューターによって音声が認識されますマイクロフォンジャックでは、音声認識がオフになります。私は反対の行動が欲しいのですが、間違いをしないために何を探し、注意する必要がありますか？

2 windows-xp speech-recognition

0

Googleの音声認識、根ざしたデバイス用のアンドロイドのビープ音（音楽）ファイルの場所

私は継続的にユーザー入力を聞いている音声認識に取り組んでいます。私はそれが継続的に聞くループを作りました。 Recognizerが聴き始めるときはいつでもオーディオファイルを再生します。オーディオの再生はいらいらさせるので必要ありません。そのファイルを削除して、そのファイルが再び再生されないようにします。

android speech-recognition speech-to-text

タグ付けされた質問 「speech-recognition」

タグ付けされた質問「speech-recognition」