狭帯域ビームフォーマーを音声分離に使用できますか


7

私の修士論文では、ビームフォーマを実装しようとしています。

私は1年前に既に遅延合計の部分を実行しました。私は言われました:

FIRフィルタリングでできること

FFT->不要な周波数ビンをヌル-> IFFT。

ビームフォーマでも同じことができます。干渉DOA(角度25で0と-90から90の間の他のすべてで1のような)の出力がわかっている場合、---> IFFTを実行して、アパーチャエレメントで重みを使用できます。

何を試してもうまくいきませんでした。私が本を読み始めるよりも、驚いたことに、私のアドバイザーが私に言った方法を見つけることができませんでした。代わりに、MVDR、LCMVのようなメソッドを見つけました。ここで、MATLABメソッドlcmvweightsを使用して各要素の正しい重みを取得し、遅延合計ビームフォーマーに適用することにしました。この方法を使用して成功したとしても、ナローバンドビームフォーマーが音声のような複雑な信号で使用できるかどうか知りたいですか?

回答:


5

4 kHzの公称スピーチ帯域幅、つまり0 Hz〜4 kHzで8 kHzを扱っている場合、スピーチは基本的に広帯域信号です。したがって、狭帯域ビームフォーミングはあまり機能しません。対象の特定の周波数ではビームパターンは問題ありませんが、その周波数から離れると、ビームパターンが劣化します。

探しているのは、広帯域ビームフォーミングです。これは、位相シフトだけでなく、実際の時間遅延(または周波数領域の周波数全体の線形位相シフト)を使用します。

通常、LCMVやMVDRなどの手法は、狭帯域信号用に開発されています。ワイドバンドの問題に対処するには、いくつかの方法があります。

  1. 各チャネルでタップ付き遅延ラインを使用します。あなたが持っている場合はチャネルとチャンネルごとにタップを、あなたの相関行列であるのx。したがって、連立方程式は非常に大きくなります。nmmnmn
  2. 一連の狭帯域ビームフォーマを使用します。この場合、それぞれがチャネルを持つビームフォーマー(周波数)があります。これで、各ビームフォーマには x相関行列がありますが、あります。したがって、前のケースよりも複雑さが軽減されます。mmnnnm
  3. (位相乗数だけでなく、時間遅延を使用して)従来のビームのセットを形成し、ビームに対して適応処理を実行できます。b

私が考えることができる最良のリファレンスは、Van Trees-Optimum Array Processingによるものです。用語のわずかな違いに出くわすことがあります-一部のテキストはMVDRが信号相関行列を使用していることを示しますが、他のテキストは信号とノイズ相関行列を使用します-どちらを見ているかに注意してください。Van Treesが2つのケースを区別していることを知っています。他のほとんどのテキストでは、1つの定式化を使用せず、MVDRと呼んでいます。


相関行列の詳細に飛び込む必要がありますか?神秘的な背景が欠けています。読んでいますが、正確に理解できません。MATLABでlcmvweights関数を直接使用できると思いますか?私がすでに実装している私の遅延和ビームフォーマでそれらを直接使用するよりも。
Kadir Erdem Demir

@KadirErdemDemirオプション2(上記から)を使用していた場合は、はい、lcmvウェイトを使用できます。私はMatlabのlcmvweightsに詳しくありません-広帯域ビームフォーミングを処理しない限り、真の遅延和ビームフォーマー(オプション1)で出力を使用できません(位相シフトの実装とは対照的)
David

5

ダレンワード、ロッドケネディ、ボブウィリアムソンによる研究では、広帯域信号の取得を可能にする遅延和ビームフォーマに適用されるフィルタの設計方法を調査しました。

図2を見るとわかるように、狭帯域ビームフォーマーは、設計周波数からの周波数の変化ほどうまく機能しません。

ここに画像の説明を入力してください

遅延和ビームフォーマーのパスでフィルターを適切に選択することで、周波数依存性の少ないアレイ応答を形成できます(以下の論文の図4)。

ここに画像の説明を入力してください

私がダレンとボブと一緒に行った後の論文は、周波数不変の設計があり、特定の方向に正確なヌル配置することが可能であることを示しています(たとえば、この論文は今年20年前のものです)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.