異なる音波波形を区別するための特徴ベクトルの設計


10

次の4つの波形信号を考えてみます。

signal1 = [4.1880   11.5270   55.8612  110.6730  146.2967  145.4113  104.1815   60.1679   14.3949  -53.7558  -72.6384  -88.0250  -98.4607]

signal2 = [ -39.6966   44.8127   95.0896  145.4097  144.5878   95.5007   61.0545   47.2886   28.1277  -40.9720  -53.6246  -63.4821  -72.3029  -74.8313  -77.8124]

signal3 = [-225.5691 -192.8458 -145.6628  151.0867  172.0412  172.5784  164.2109  160.3817  164.5383  171.8134  178.3905  180.8994  172.1375  149.2719  -51.9629 -148.1348 -150.4799 -149.6639]

signal4 = [ -218.5187 -211.5729 -181.9739 -144.8084  127.3846  162.9755  162.6934  150.8078  145.8774  156.9846  175.2362  188.0448  189.4951  175.9540  147.4631  -89.9513 -154.1579 -151.0851]

信号

信号1と2は同じように見え、信号3と4は同じように見えます。

入力としてn個の信号を受け取り、それらをm個のグループに分割するアルゴリズムを探しています。各グループ内の信号は類似しています。

このようなアルゴリズムの最初のステップは、通常、各信号の特徴ベクトルを計算することですFi

例として、特徴ベクトルを[width、max、max-min]と定義します。この場合、次の特徴ベクトルが得られます。

F1=[13,146,245]

F2=[15,145,223]

F3=[18,181,406]

F4=[18,189,408]

特徴ベクトルを決定する際に重要なことは、類似した信号は互いに近い特徴ベクトルを取得し、異なる信号は遠く離れた特徴ベクトルを取得することです。

上記の例では、次のようになります。

|F2F1|=22.1,|F3F1|=164.8

したがって、信号2は信号3よりも信号1に非常に類似していると結論付けることができます。

特徴ベクトルとして、信号の離散コサイン変換の項を使用することもあります。以下の図は、離散コサイン変換からの最初の5項による信号の近似とともに信号を示しています。 コサイン変換

この場合の離散コサイン係数は次のとおりです。

F1 = [94.2496  192.7706 -211.4520  -82.8782   11.2105]

F2 = [61.7481  230.3206 -114.1549 -129.2138  -65.9035]

F3 = [182.2051   18.6785 -595.3893  -46.9929 -236.3459]

F4 = [148.6924 -171.0035 -593.7428   16.8965 -223.8754]

この場合、次のようになります。

|F2F1|=141.5,|F3F1|=498.0

この比率は、上記のより単純な特徴ベクトルほど大きくはありません。これは、単純な特徴ベクトルの方が優れているという意味ですか?

これまでのところ、2つの波形のみを示しています。以下のプロットは、そのようなアルゴリズムへの入力となる他のいくつかの波形を示しています。このプロットの各ピークから1つの信号が抽出され、ピークの左側の最も近い最小値から始まり、ピークの右側の最も近い最小値で停止します。痕跡

たとえば、サンプル217と234の間のこのプロットからsignal3が抽出されました。別のプロットからSignal4が抽出されました。

気になる場合は。このような各プロットは、空間内のさまざまな位置でのマイクによる音響測定に対応しています。各マイクロフォンは同じ信号を受信しますが、信号は時間的にわずかにシフトし、マイクロフォンごとに歪んでいます。

特徴ベクトルは、信号を互いに近い特徴ベクトルと一緒にグループ化するk-meansなどのクラスタリングアルゴリズムに送信できます。

波形信号の識別に優れている特徴ベクトルの設計に関する経験やアドバイスはありますか?

また、どのクラスタリングアルゴリズムを使用しますか?

どんな答えでも前もって感謝します!


Mのテンプレートの1つを使用した入力信号のグッドドット積はどうですか?最小二乗誤差を持つものを選びます。それが私にとっての出発点になります。たまたまそのようなことを試したことはありますか?
Spacey

こんにちはMohammad!問題は、事前に波形がわからないことです。ピーク周辺のすべての信号に興味があり、それらは私が事前に知らない多くの異なる形式を持っている可能性があります。
アンディ

これらのベクトルを直接「特徴」として使用するよりも、これらのベクトルを特徴付ける新しい特徴を見つけようとする理由は何ですか?(ただし、長さは同じでなければなりません)。k-meansクラスタリングの場合、取得された信号の最小値で抽出されたこれらの小さなベクトル間の「距離」が最初に計算され、次にアルゴリズムはそれらを最小分散のkセットにグループ化しようとします。あなたは後のようです。
A_A

こんにちはA_A!1.ベクトルの次元が削減されます。離散コサイン係数を使用する場合、18から5までの信号3の場合。2.平滑化が行われています。信号にはノイズが多く、急激な変動には興味がありません。
アンディ

3
機械学習の人々は、情報を捨てるべきではないと主張するでしょう-システムはすべてについて学ぶべきです。もちろん、彼らは実行に数百万年かかるアルゴリズムを設計する人々と同じですが、要点はいくつかのメリットがないわけではありません。本質的に、あなたはできるだけ少ない情報を捨てて、残っているものについて学びたいです。これは、ベイジアンフレームワークで実行する必要がある問題と思います(ほとんどの信号処理は今日では当然のことです)、これは、重要な機能を理解することが重要ではないという意味ではありません。
Henry Gomersall

回答:


2

信号を分離するための客観的な基準のみが必要ですか、または誰かが聞いたときに何らかの類似性があることが重要ですか?もちろん、少し長い信号(1000サンプル以上)に制限する必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.