デスクトップ環境の音声制御

16

ユーザーの音声コマンドに応答し、口頭コマンドGIVENに従ってスクリプトを実行できるシステムを有効にしたいと思います。

理想的には、コンピューターが常に聴いているようにします。

「コンピューター」というバズワードを聞くと、10秒間（またはそれ以上）コマンドをアクティブにしてリッスンします。

一度アクティブになり、リスニング中に、別のバズワードのセットでスクリプトを実行できるようにしたいと思います。

例えば....

（コンピューターはアイドル状態です）「コンピューター」（コンピューターはすぐにリッスンします）「新しいメッセージにアクセスします」（流行語であるメッセージ* IGNORES「新しいアクセス」-コンピューターはスクリプトを実行し、進化または共感を開きます）。ブラウザ用のもの、ウィンドウを閉じてデスクトップを表示するもの、または本当にたくさんのものがあります。

これも可能ですか？

microphone voice-recognition

— ボルグ支配
ソース

7

Gnome-Voice-Control

これは、Google Summer of Code 2007の一部として開発されたもので、Gnomeデスクトップの使いやすさを向上させる機能を開発するためのアイデアでした。

目標は、デスクトップ音声制御システムを実装することです。このシステムは、オーディオ入力（マイク）を監視するアプリケーションで構成され、重要なオーディオ信号が検出されると、ソフトウェアが信号をキャッチ、処理、認識し、Gnomeデスクトップ上で目的のアクションを実行します。一連のアクションには、アクティブウィンドウを最大化、最小化、閉じることが含まれます。特定のプログラムを開きます。あるデスクトップから別のデスクトップに切り替える。とりわけ。GnomeVoiceControlは、CMUでCMUに実装されています。CMUSphinxは、音声をテキストに変換するために作成されたオープンソースツールです。

著者によるスライドショー

残念ながら、基本的な「目標」をはるかに超えて開発されていないように見えますが、今年はブルガリア語やトルコ語などの新しい言語のサポートを追加する活動があるようです。

インストールするには：

sudo apt-get install gnome-voice-control

カモノハシ

カモノハシと呼ばれる興味深いプロジェクトがあります-基本的には、Wineで実行されるDragon Naturally SpeakingのLinuxフロントエンドです。

このアプリケーションの名声は、「WindowsやLinuxのプログラムやスクリプトを起動することもできます。たとえば、「ターミナルを起動する」などです。

ヴェディック

これは、Unityインターフェースで動作するという新しいプロジェクトです。

プロジェクトページには、「実行[プログラム名]」と認識されると書かれています。したがって、理論的には、[プログラム名]は実行したい任意のスクリプトになります。

— フォスフリーダム
ソース

非常に速い応答をありがとう。そのプログラムのことを聞いてインストールしましたが、過去の設定を取得していないようです。単に「config」と表示されます。私はこの面で多くの作業が行われていないことに驚いています。ワインと一緒に走れる窓がありますか？

— ボルグドミネーション

1

シナプスにあるgnome音声の古いバージョンでも同じ結果が得られました。私はウェブサイトから最新のものを試してみましたが、それはさらに進むように見えましたが、私はそれを適切に動作させることはありませんでした。手作業による依存は苦痛でした。

— ケンドリック

3

サイモンは聞く

これは、身体障害者向けに最初に開発された音声認識によってマウスやキーボードを置き換えることを目的としたオープンソースプロジェクトです。

アプリケーションをインストールできる場所からppaがあります：ppa：grasch-simon-listens / simon

— タカット
ソース

simonはkdeでのみ動作しますか？本当に素晴らしく見えるのでインストールしましたが、gnome-shellで動作するようには見えません。特にウィンドウ管理。たとえば、すべてのウィンドウを表示したい場合、kde envとgnome envでは異なる動作をしますか？

— ジョシュアロビソン

1

Ubuntu <= 12.04からppaにインストールするときに依存関係を解決する必要がありますが、最近試したことはありません。また、GNOMEシェルにどのように干渉するかもわかりません。12.10のバージョンは（まだ）ありません。

— タックカット

3

Google2Ubuntu

Google2Ubuntuは、Google音声認識APIの音声コマンドを使用してコンピューターを制御できるツールです。

ターミナルで以下のコマンドを実行してインストールしgoogle2Ubuntu、

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

ソース

— アビナッシュ・ラジ
ソース

1

Linux音声認識

Linuxディストリビューションで実行するように開発されており、非常に設定可能で拡張が容易で、カスタム辞書、コンテキストベースの認識、ディクテーションモード、設定可能なマクロをサポートしています。

Linux Speech Recognitionをインストールするには、プロジェクトのGitHubページにアクセスしてください。ZIPファイルをダウンロードして解凍します。

次に、いくつかの依存関係をインストールします。

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

ターミナルで展開したフォルダー（Palaver-master）を開き、セットアップを実行します。

cd /~Path-to-folder~/Palaver-master/
./setup

これで、ホットキーを割り当てて録音を有効にできます。これを行うには、[システム設定...]> [キーボード]> [ショートカット]> [カスタムショートカット]をクリックして、プラスボタンをクリックしてショートカットを追加し、音声認識に名前を付けて、コマンドを次のように設定します：

/~Path-to-folder~/Palaver-master/hotkey

[適用]をクリックし、ショートカットをクリックしてから、ホットキーを割り当てて音声認識を有効にします。

安定したビルドはまだリリースされていないため、この段階でコマンドが完全に機能することを期待しないでください。多くのフレーズが認識されますが、実際のアクションは実行されません。

— ロドリゴ・マルティンス
ソース

現在、Palaverは死んでいます：github.com/JamezQ/Palaver/issues/110#issuecomment-398646686

— user2740

0

Snips.ai

ちょうどpi3で試してみました-Dockerで潜在的な
実行があるようです

https://snips.ai/

— ポール・シュナイダー
ソース

1

Ask Ubuntuへようこそ。このツールと提携している場合は、投稿で明示的にそうする必要があることに注意してください。スパマーにならない方法をご覧ください。

— グローフィンデル

1

公式ウェブサイトには次のように書かれています：オープンソース：私たちは時間をかけてSnipを開くことを約束しています。

— karel