オーディオ信号の自己相関を生成するときに、いびき/呼吸と「相関」するかどうかを確認するために、ひび割れがありました。私は単純なアルゴリズムを実行しています(1.0を0番目の要素として生成します。これは良い兆候です)が、自己相関が強いかどうかを判断するために結果を評価する方法と、おそらくそれを使用して分離する方法について疑問に思っていますさまざまな音源。
質問1:自己相関のRMS(要素をスキップする)は、「品質」の測定基準と同じくらい良いですか、それとももっと良いものがありますか?
詳しく説明します。 数値の方法(チャートを「見る」のではなく)で、自己相関の高い信号と自己相関の低い信号を区別します。
(私は他にどんな質問をするべきかを知るのに十分なほど知りません。)
初期の結果の一部: 場合によっては、自己相関(RMSまたはピーク)がいびきの劇的なジャンプを示します。正確に私が知りたい応答です。他の場合では、これらの測定値には明らかな動きがまったくありません(これは2つの応答を伴う2つのいびきである可能性があります)。
更新-5月22日: ようやく、これについてさらに作業する時間を得ました。(文字通り苦痛な別のアプリで引き延ばされました。)私は自己相関の出力をFFTに入力しましたが、出力はやや興味深いです。いびきが始まると、原点付近でかなり劇的なピークを示しています。
だから今、私はこのピークをどういうわけか量子化する問題に直面しています。奇妙なことに、絶対的な大きさの点で最も高いピークが別のときに発生しますが、ピークと算術平均の比率を試してみたところ、かなりうまくいきました。それでは、FFTの「ピーク」を測定するいくつかの良い方法は何ですか。(そして、してください -このことは、自身の尾を飲み込むの近くにすでにある:)私はそれのFFTを取る必要があると言うことはありません。)
また、中央にゼロ(定義では1.0のマグニチュード)が入力された自己相関結果をミラー反射すると、FFTの品質が多少向上する可能性があることに気付きました。これは両端に「尾」を置くでしょう。これは(おそらく)良いアイデアですか?鏡像は直立する必要がありますか?(もちろん、あなたが何を言っても試してみるつもりですが、詳細については少しヒントが得られるかもしれません。)
試した平面度-
私のテストケースは、「行儀の良い」カテゴリと「問題のある子供」カテゴリに大別できます。
「正常に動作する」テストケースの場合、自己相関のFFTの平坦性は劇的に低下し、いびきの間にピークと平均の自己相関の比率が上昇します。これらの2つの数値の比(ピーク比を平坦度で割った値)は特に敏感で、呼吸/いびきの間に5〜10倍の上昇を示します。
ただし、「問題のある子供」の場合、数字は正反対の方向を向いています。ピーク/平均比はわずかに低下しますが、平坦度は実際には50〜100%増加します
これら2つのカテゴリの違いは、(主に)3つあります。
- 「問題のある子供たち」の騒音レベルは(通常)高くなります
- 「問題のある子供」では、オーディオレベルが(ほとんどの場合)低くなります。
- 「問題のある子供」は、呼吸が多く、実際のいびきが少ない傾向があります(両方を検出する必要があります)
何か案は?
更新-5/25/2012: 勝利のダンスをするのは少し時期尚早ですが、ポイントに関する自己相関を反映し、そのFFTを取り、次にスペクトルの平坦性を行ったとき、私の複合比率スキームは良いジャンプを示しましたいくつかの異なる環境。自己相関を反映すると、FFTの品質が向上するようです。
ただし、マイナーな点の1つは、反射された「信号」の「DC成分」がゼロであるため、0番目のFFT結果は常にゼロであり、このことはゼロを含む幾何平均を壊すことです。しかし、0番目の要素をスキップしても機能するようです。
私が得ている結果は、いびき/呼吸をそれ自体で識別するのに十分ではありませんが、かなり敏感な「確認」のようです-「ジャンプ」が得られない場合、それはおそらくいびき/息ではありません。
私はそれを詳しく分析していませんが、起こっているのは、息/いびきの間にどこかで口笛の音が発生し、その口笛が検出されていることです。