ドラゴンのような音声ディクテーションソフトウェアがスピーカー側からしか動作しないのはなぜですか?


4

私のラップトップや携帯電話が私の言うことを口述したりタイプしたりするのではなく、反対側の相手の言葉を書いてください。 GoogleやNuanceがその機能を有効にしないのはなぜですか?それも可能ですか?それが機能するために何が必要でしょうか?


理論的には 恐らく Skypeが生成している音声出力信号をDragonが監視できた場合は可能です。 なぜ 彼らはそれをやっていないのですか?おそらく十分な需要はありません。もしDragonがプラグインアーキテクチャを持っているなら、これは良い趣味のプロジェクトかもしれません…;)
FrustratedWithFormsDesigner

回答:


1

あなたが話しているときあなたの声はあなたのコンピュータのマイクとオーディオハードウェアを通して録音されています。このオーディオ信号は、お使いのコンピュータのどのアプリケーションでも利用できます。 Skypeで誰かに話しかけているとき、音声信号はたくさんのパケットにエンコードされています。音声信号をデコードするには、Skypeのプロトコルをリバースエンジニアする必要があります。

スピーカーフォンモードで携帯電話で話している場合は、音声認識には品質が十分ではない可能性があります。また、音声認識ソフトウェアはあなたの声と相手の声の両方について訓練される必要があるでしょう。

Googleがここでどのような関連性を持っているのかわかりません。


その答えには間違った情報がいくつかあります。ソフトウェアは常に例えばラインからオーディオ信号をつかむことができます。

理論的には真実だが、emddudleyは真実だ。ドラゴンは言葉を正しく認識するためにあなたの声を訓練する必要がある。これはDragonのためだけのものですが、諜報機関はこれを長年にわたって行ってきましたが、Imは自分たちのアルゴリズムをより良いものにすることに消極的であると思います。
0x7c0

それがここに属しているというわけではありませんが、電話の録音に関する法的な問題もいくつかあります。
Chad

2
Googleの関連性はGoogle Voiceツールにあります。技術的には、Google Voiceは着信通話を転記しますが、これはボイスメールに送信した場合に限られます。それからそれはあなたにボイスメールメッセージをテキストで送ることができます。
music2myear

私はチャドと一緒にいます。ここに重大な重大な法的結果がいくつかあります。私は弁護士ではありませんが、電話の成績証明書に同意する必要があると確信しています。 。 。
surfasb

0

(Googleとは異なり)Dragon NaturallySpeakingは、音声を単語に変換する前に訓練を受ける必要があります。

誰かがあなたの自動応答装置にGoogleの声でメッセージを残したとき、グーグルはラインのもう一方の端の発信者のためのテキストの書き起こしにスピーチをします。

通話中に音声品質が大幅に変化することがよくあるため、音声認識がさらに困難になります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.