いびきを特定するための私の終わりのない探求で、「スペクトルの平坦性」が信号の「品質」の公正な尺度であるように見えることがわかりました。
FFTパワーデータポイントの相乗平均を同じポイントの算術平均で割ったものとして、スペクトル平坦度を計算しています。
次に、(ここでは少しひねりを加えて)実行中の(50フレームを超える)算術平均とスペクトル平坦度の標準偏差を計算し、実行中の標準偏差を実行中の平均で割った「正規化」標準偏差を計算しています。
私のサンプルでは、音声が「良い」(つまり、眠っている被験者の呼吸音やいびき音を確実に追跡している)場合、この指標は約(最大程度)よりも大きく、通常は落ちるオーディオが「泥の中に」ある場合、未満。(他の要因と一緒に動くしきい値を使用することで、この差別をある程度改善できますが、それはおそらく別のトピックです。)また、バックグラウンドノイズが大きい場合(たとえば、誰かが部屋に入ってざわめくとき)は、測定値がを超えることもわかります。)。0.5 0.2 1.0
だから、私の基本的な質問は:私が測定しているものの名前(「スペクトル平坦度の正規化された標準偏差」を超えて)はありますか、そしてメトリックが「意味するもの」の概念的な説明を誰かが提供できますか?
(私は信号の「品質」について他のダースのメトリックを試しましたが、これはこれまでで最も良いようです。)
追加: 私はおそらく、単純なスペクトル平坦性が測定しているもの(ウィキペディアの記事のみ)について特に優れた概念的なハンドルを持っていないことを認めるべきです。そのため、それ以上の説明はありがたいです。