Siriは「Hey Siri」と言って私をどのように認識しますか?


8

私は私のiPhoneは、継続的に言って、私のためにリスニングできる方法を理解しようとしていますHey SiriAlexaHey CortanaまたはOkay Googleすぐに私のバッテリーを下に排出せず。

2種類のアルゴリズムを想像しました。10 ms幅のスライスなどの時間のスライスを200 msごとに記録し、特定の周波数で同期検出を実行するもの。ただし、これらのパラメータは私の声の特性に強く依存します。さらに、それは絶えずHey Siriどこかの真ん中で一致することを試み続けるためにそれでも多くのCPUパワーを消費します。

どのような効率的な低電力アルゴリズム/実装(ハードウェアまたはソフトウェア)がこのようなタスクを実行できますか?

これはどういうわけか私が思うこの特許に関連しています:https : //www.google.com/patents/US20160253997

隠れたマルコフモデルについての記事をいくつか読んだが、それが非常に低消費電力のアプローチであるとは思えない。

回答:


6

「OK Google」はGoogleの多くの出版物に記載されています

ディープニューラルネットワークを使用した堅牢な小フットプリントキーワードスポッティングのための自動ゲイン制御とマルチスタイルトレーニング

小フットプリントのキーワードスポッティングのための畳み込みニューラルネットワーク

これは、キーフレーズ用に特別にトレーニングされたDNNに基づいており、非常に高速に実行されます。モバイルでも電力をあまり消費しません。

Alexaスポッティングは、Snowboyと同じ人によって実装され、利用可能です

更新:Appleはその実装についてここで説明しています


1

@ hotpaw2の回答を詳しく説明するために、「Hey Siri」は低電力M9コプロセッサーチップ上で実行されます。このチップは、ヘルスアプリの足跡の監視なども行います。したがって、M9チップのない古いデバイスでは、「Hey Siri」を機能させるためにiDeviceをプラグインする必要があります。

ハードウェアにとらわれないアルゴリズムの天才ではなく、低消費電力のハードウェア実装が重要だと思います

参照:


0

いくつかの野生の推測:

オーディオ処理クロックレートまたはデューティサイクルで動作する専用ハードウェア(追加の「M」チップまたはSOCロジックブロックと独自の分離された電源ドメイン)は、データの小さなバッファーで動作し、膨大なメモリ階層を持つGHz対応のCPUよりも消費電力が大幅に少なくなります。メインCPUは、最初の推定IDが十分に高い場合にのみウェイクアップする必要があるため、最初の検出アルゴリズムは必ずしも十分である必要はありません。また、同じバッテリー持続時間のスマートフォンと比較して、バッテリーがインイヤーBluetoothヘッドセットでどれほど小さいかを検討してください。単純なオーディオ処理では、比較的大きな携帯電話のバッテリーが急速に消耗することはありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.