周波数範囲の「変動性」を判断する方法は?


8

これは前の質問の続きです。

私は呼吸といびきの音を分析しようとしています。今はいびきをかなりうまく検出できていますが、呼吸はより大きな課題です。

分析した周波数範囲(約4KHz、フレームサイズ1024で約8KHzでサンプリング)を約5つのサブレンジに分割すると、サブレンジの1つが(スペクトル差を使用して)良好な感度を示すことがよくあります。全体の範囲でノイズ。秘訣は、どの部分範囲をいつ「信頼」するかを決定することです。

おそらく「信頼できる」サブレンジは約2Hzと0.05Hzの間のレートで変動性を示しますが、「悪い」サブレンジはよりランダムに振る舞い、それらの変動のほとんどは短い間隔です。

ある種のアルゴリズムを組み合わせて、1秒未満の解像度で値を平滑化し、より長い間隔で変動性を計算することもできますが、この種の「缶詰」アルゴリズムはないのでしょうか。その背後にある理論の小片?

助言がありますか?

[注:理論的には、FFTを使用してこの情報を抽出できることは承知していますが、野球のバットを使ってノミを殺しているようです。多分もう少し軽量なものでしょうか?]

追加:

ある意味で(類推を使用して)、RF送信で「ベースバンド」信号を検出しようとしています(「RF」のみがオーディオ周波数であり、「ベースバンド」は8Hz未満です)。そして、ある意味では、「RF」は「スペクトラム拡散」です。検出したい音は、多くの高調波を生成したり、複数の周波数成分を分離したりする傾向があるため、スペクトルの1つの帯域にノイズが多すぎると、おそらく別のものを利用してください。ほとんどの「ノイズ」が2Hzを超え、信号が2Hz未満であるという前提で、さまざまな周波数帯域のSNRに似たメトリックを基本的に決定することが目標です。

このアルゴリズムへの入力として、8Hz間隔で測定された各帯域の生の振幅(含まれるすべての周波数でのFFT振幅の合計)があります。

(私は正式なSNR測定を行っていませんが、処理されたスペクトル全体のSNRはしばしば1.0に近いかそれ以下に見えることに注意してください-Audacityなどのツールでサウンドエンベロープを視覚的に観察すると、エンベロープは目立ちます(耳が呼吸音を明確に識別できる場合でも)。このため、バンドを分析してSNRが適切なものを見つける必要があります。


変動性とは、時間を意味するのか、それとも周波数全体を意味するのか?
フォノン

時間による変動。およそ0.05Hzと2Hzの間のレートで、より長いまたはより短い間隔での変動を無視します。
ダニエルRヒックス

1
@DanielRHicksここで正確に何を検出しようとしているのですか?質問を確実に理解したい-最初に測定したい機能を定量化しようとしています。
スペイシー

追加された詳細を参照してください。
ダニエルRヒックス

回答:


4

ダニエル、

あなたの質問をもう一度読んでみると、私が「ガボール帯域幅」として知られていることがこの場合、「スペクトル変動」を測定しようとしているので役立つかもしれません(Dilipは私に良い答えを提供してくれましたスペクトルモーメントに関する質問はこちら)。

私がそれをさらに研究したとき、ガボール帯域幅は実際にはスペクトルがその平均からどれだけ「広がる」かの尺度であるように見えます。(したがって、モーメントの操作)。

見て、あなたの考えを見てください。



1

必要なものはノミよりはるかに大きいようです。そのため、逆方向に進む必要があり、FFT以外のことも行う必要があります。おそらく、低周波数のケプストラムまたはケプストラム分析により、「出口」周波数を見つけます。


ええ、それは調べる価値があるように見えます(または私はotniと言うべきですか?)。
ダニエルRヒックス

「ケプストラム」をデータに適用して、フレーム間隔よりも長い時間間隔を分析する明確な方法が見当たらないと思います。
ダニエルRヒックス

1

X(m,n)

これが私が提案するものです:

各nについて:

  • の自己相関計算しますrn(l)X(:,n)
  • rn(l)

自己相関のピークが最も高いサブバンドを選択します(=より「ピッチー」)。

調べるべき尖度測定:

  • maxlLrn(l)rn(0)
  • 尖度
  • 幾何平均と算術平均の比率

これらの種類のメトリックは、たとえば有声/無声の音声を区別するために使用されます。


算術平均よりも幾何平均が与える価値について詳しく説明していただけますか?また、tau = 0での自己相関に対する正規化された自己相関の最大値に言及するとき、なぜそれが性能指数なのですか?
Spacey
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.