スペクトル平坦度の標準偏差—では、概念的に何を測定しているのですか?


8

いびきを特定するための私の終わりのない探求で、「スペクトルの平坦性」が信号の「品質」の公正な尺度であるように見えることがわかりました。

FFTパワーデータポイントの相乗平均を同じポイントの算術平均で割ったものとして、スペクトル平坦度を計算しています。(R2+I2)

次に、(ここでは少しひねりを加えて)実行中の(50フレームを超える)算術平均とスペクトル平坦度の標準偏差を計算し、実行中の標準偏差を実行中の平均で割った「正規化」標準偏差を計算しています。

私のサンプルでは、音声が「良い」(つまり、眠っている被験者の呼吸音やいびき音を確実に追跡している)場合、この指標は約(最大程度)よりも大きく、通常は落ちるオーディオが「泥の中に」ある場合、未満。(他の要因と一緒に動くしきい値を使用することで、この差別をある程度改善できますが、それはおそらく別のトピックです。)また、バックグラウンドノイズが大きい場合(たとえば、誰かが部屋に入ってざわめくとき)は、測定値がを超えることもわかります。)。0.5 0.2 1.00.20.50.21.0

だから、私の基本的な質問は:私が測定しているものの名​​前(「スペクトル平坦度の正規化された標準偏差」を超えて)はありますか、そしてメトリックが「意味するもの」の概念的な説明を誰かが提供できますか?

(私は信号の「品質」について他のダースのメトリックを試しましたが、これはこれまでで最も良いようです。)

追加: 私はおそらく、単純なスペクトル平坦性が測定しているもの(ウィキペディアの記事のみについて特に優れた概念的なハンドルを持っていないことを認めるべきです。そのため、それ以上の説明はありがたいです。


2
あなたは計算を行い、誰かが同じアイデアを思いついて名前を付けたかどうか尋ねています。そうでなければ、誰かがあなたが考案したものの概念的な説明を思いつくことができますか?きっとあなたはあなたの「小さなひねり」を入れるための何らかの理論的根拠を持っていたに違いない、あるいはあなたはインディアナ・ジョーンズのように、あなたが進んでいる間それを作り上げただけでしたか?
Dilip Sarwate、2012年

3
私は基本的に私が上に行くにつれて物事を作るだけです。テクニックを見つけ、それをデータに適用し、結果を観察して、それが有用であると思われるかどうかを判断します。もしそうなら、私は改良を試みます。これは退屈なプロセスですが、このプロジェクトに取り組んでいる音声分析の「専門家」が彼の選択を破って家に帰りました。
ダニエルRヒックス

回答:


4

スペクトルの「平坦性」に関心があるので、実際には、信号がホワイトノイズにどれだけ近いかに興味があります(定義上、スペクトルとランダムな位相はフラットです)。後退した場合、測定値の1つは、ホワイトノイズリファレンスに対する観測の「距離」です

情報理論の観点からの明白な尺度は、カルバック・ライブラーダイバージェンスです。あなたはそれのすべての部分を理解する必要ありません、それは両方の分布の間の距離をビットで測定します(ログベース2を使用する場合)。

この場合の良い点は、参照がフラットであるため、スペクトルのエントロピーが残ることです。多くの既存の実装があります(たとえばscipyで)。

まだ安全面にあることに注意してください。分布がほぼガウス分布である場合、両方の測定(エントロピーとstd)は比例します。ただし、エントロピーはより一般的で、より原理的です。拡張機能として、他のタイプのノイズ(たとえば、1 / f)に一般化することができます。


奇妙なことに、「通常の」エントロピー-合計p log p-は私の問題について多くの情報を伝えていないようです。(私はそれを標準偏差にしようとはしなかったと思いますが。)
ダニエルRヒックス2012年

3

信号の統計情報(またはスペクトルなどの信号の関数)と信号に埋め込まれたノイズの信頼できる一貫した差異を使用して、一方の確率と他方の確率を推定できます。

ホワイトノイズやインパルススパイクなどの信号から目的の信号を区別する信号スペクトル形状を特徴付けるための無数の方法の1つをランダムに見つけた(偶然見つけた)ようです。ランダムな可能な解決策を見つけても、それが無効になることはありません(それが進化的/遺伝的プログラミングの1つの基礎です)。しかし、あなたが見つけた測定値がどれほど強固であるかは、実験的な課題として残されています。


問題は、通常のエントロピーなどの他の指標は、この指標ほど多くの期待を示さないということです。なぜこれが良く見えるのかを理解できれば、おそらくそれを改善できるでしょう。
ダニエルRヒックス

hotpaw2、あなたは信号とノイズを区別できる他のいくつかの方法、またはFFTマグニチュードスペクトルの形状の「尺度」に言及していますが、どのような方法が思い浮かびますか?
Spacey

まさに思い浮かぶ?進化的/遺伝的/ Hadoopタイプの検索アルゴリズムは、十分なデータから、おそらく事実の後でないと思いつかず、通常は正確であるとは説明されていない「形状」のものをマイニングすると言われています。
hotpaw2 2012年

@ hotpaw2申し訳ありませんが、おそらく私の質問は明確ではありませんでした。たとえば、「ピーク」がどのような単純な測定方法で存在するのか(スペクトルがどのように見えるかの例として)疑問に思っていました。あなたが言った教師なしの学習方法は確かに強力ですが、あまりにも凝ったものについては尋ねませんでした。
Spacey
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.