Dragon NaturallySpeakingの代わりに?


回答:


18

ウィキペディアには、この問題に関する記事全体があります。

残念ながら、現時点では十分に機能するソリューションはありませんが、進行中のプロジェクトの膨大なリストがあります。

ソリューションのリストをざっと調べて、ニーズに合ったものがあるかどうかを確認することをお勧めします。

カモノハシ

WINEを使用してDragon Naturally Speakingを実行する可能性は常にあります。カモノハシプロジェクトは、すべてのLinux / Xアプリケーションにドラゴンの出力をリダイレクトするためのソフトウェアを作成している、と彼らは非常に遠くに沿っています。

必ずこれを見てください。


5

最新の回答については、2018年3月の記事「Best Free Linux Speech Recognition Tools – Open Source Software」をご覧ください。

この記事では、Linuxに最適なオープンソースの音声認識ソフトウェアについて説明します。一部のソフトウェアは開発の初期段階にあるため、広く採用する準備ができていないことに注意してください。

推奨事項を検討する前に、ジャスパーは特に言及する価値があります。常時接続の音声制御アプリケーションを開発するための優れたオープンソースプラットフォームです。HTKが下に表示されない理由を疑問に思うかもしれません。確かに、HTKは人気のある音声認識ツールキットです。ただし、HTKは推奨ソリューションで機能する資格がありません。著作権はマイクロソフトが所有しているからではなく、単にプロプライエタリなソフトウェアだからです。

手元にある6つの無料の音声認識ツールを調べてみましょう。各タイトルについて、完全な説明と機能の詳細な分析を含む独自のポータルページをコンパイルしました。

オープンソースの音声認識ツール

  • BaiduのDeepSpeechアーキテクチャのDeepSpeech TensorFlow実装。
  • Julius 2パス大語彙連続音声認識エンジン
  • Simon Flexible音声認識ソフトウェア
  • CMUSphinx モバイルおよびサーバーアプリケーション用の音声認識システム
  • deepspeech.py​​torch Baiduのワープ-CTCを使用してDeepSpeech2の実装。
  • 音声認識研究者向けに設計されたKaldi C ++ツールキット。


3

freespeech-vr

テキストエンジンに対するまともなオープンソースのスピーチです。ここにソースコードGoogle Code上

設定には少し時間がかかりますが、Dragon Naturally Speakingの設定ほど洗練されていないことに注意してください。


2
FreeSpeechは維持されていないようです。これは、Ubuntuの10以来、PPAを提供していない
JellicleCat

2
今そこにあるPythonの3ポート FreeSpeechのは。
dotancohen

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.