信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

2
狭帯域ビームフォーマーを音声分離に使用できますか
私の修士論文では、ビームフォーマを実装しようとしています。 私は1年前に既に遅延合計の部分を実行しました。私は言われました: FIRフィルタリングでできること FFT->不要な周波数ビンをヌル-> IFFT。 ビームフォーマでも同じことができます。干渉DOA(角度25で0と-90から90の間の他のすべてで1のような)の出力がわかっている場合、---> IFFTを実行して、アパーチャエレメントで重みを使用できます。 何を試してもうまくいきませんでした。私が本を読み始めるよりも、驚いたことに、私のアドバイザーが私に言った方法を見つけることができませんでした。代わりに、MVDR、LCMVのようなメソッドを見つけました。ここで、MATLABメソッドlcmvweightsを使用して各要素の正しい重みを取得し、遅延合計ビームフォーマーに適用することにしました。この方法を使用して成功したとしても、ナローバンドビームフォーマーが音声のような複雑な信号で使用できるかどうか知りたいですか?

1
ランダムサンプリングと均一サンプリング
で、この論文一様サンプリングよりも優れた性能を示すことができるランダムにサンプリング:ラスティグの、彼は直感的表示されます何かについて話します。これらのスライドの 15ページ目からこれを理解しようとしましたが、本当に何も理解できません。 周波数係数のランダム置換を行うと、信号の類似性の点でより良い再構成が得られるのはなぜですか?なぜこれはより良い再構成をもたらすのですか、そしてこの現象の背後にある直感は何ですか?

2
カルマンフィルターにクォータニオンを統合するためにルンゲクッタを使用する理由
現在、カルマンフィルタリングについて読んでいます。特に、IMUセンサーのフュージョンとキャリブレーションに「拡張」と「無香」のバリアントを使用することに興味があります。 無香と拡張カルマンは、四元運動を推定するためのフィルタリングの比較、四元数は、3D回転を表すために使用されます。 単位クォータニオンを使用して3D回転を表すことができることを理解しています。これらは、絶対姿勢(ユニバーサルリファレンスからの回転)、相対回転、または角速度(1秒あたりの速度を表す回転、またはその他の固定時間)を表すのに適しています。 ただし、このペーパーでは、Runge-Kutta統合、特にRK4の使用について説明します。RK4をクォータニオンと共に使用しますが、これが何を必要とするか、なぜ必要なのかについての詳細を提供していないようです。これはそれについて言及している紙の部分です… ステップk − 1の状態ベクトルが与えられると、方程式1 [f = dq / dt =qω/ 2]を時間をかけて∆t(つまり1.0現在のサンプリングレートで割った値)。4次のルンゲクッタスキームを使用します。 キネマティクスで位置を統合するためにRunge Kuttaに出会ったことがあります。ここでそれがどのように、またはなぜ必要になるのか、私にはよくわかりません。 私の素朴なアプローチは、既存の姿勢qに角速度ωを単純に乗算して、期待される新しいqを取得することです。ここで数値積分が必要な理由がわかりません。おそらく、単位時間ωを∆tで発生する変化に「スケーリング」することですが、ωを直接操作する(分数電力∆tに上げる)だけで、非常に簡単に実行できます。 誰か知ってる?

2
Pythonを使用してオンラインでデジタル信号をリアルタイムでフィルタリングする
現在、バンドパスフィルターを信号にリアルタイムで適用しようとしています。一定のサンプリングレートで入力されるサンプルがあり、対応するバンドパスフィルター処理された信号を計算したいと思います。 これを行う最善の方法は何でしょうか?いくつかの新しいサンプルが入ってくるたびに信号全体(または少なくとも巨大なビット)をフィルタリングする必要があるか、またはフィルタリングされた新しい部分を効率的に決定できる方法(スライディングDFTなど)があるか信号? バターワースフィルターを使用したい(オフライン分析のために、現在scipyのバターとlfilterを使用しています)。この関数がフィルター遅延を返すことができることは知っていますが、一定の信号を取得するためにそれを使用する方法がわかりません。

2
信号処理が独自の分野になったのはいつですか?
これはおそらく少し難しい質問ですが、信号処理が独自の分野になったのはいつですか?それは、最初は数学と統計学の一分野であったように見えますが、その後、独立した分野として浮上しました。 これをカバーする本、またはおそらくいくつかの特集記事があれば、私はそれを読みたいです。 PS。関連するタグの追加にご協力ください。何も見つかりませんでした

1
レイリーチャネルのiid​​の仮定の実用性
OFDMシステムがレイリーチャネルで動作している場合、iidを使用するという前提が(実用的な観点から)正確/有効であるとはどの程度かを理解したいと思います。これは、チャンネルがフラットでゆっくりとしたフェージングに遭遇する必要があることを意味しますか?そうでない場合、どのような条件下で、iidの仮定は実際に受け入れられると見なすことができますか? ヒントはありますか?

1
高速DCT実装
次の2つの論文にある高速8x8 DCTアルゴリズム図に従う方法を理解するのに苦労しています。 (1)Chenらによる離散コサイン変換の高速計算アルゴリズム。 そして (2)Loefflerらによる11の乗算を伴う実用的な高速1-D DCTアルゴリズム。 特に、(2)のアルゴリズムを示す2番目の図は次のようになります。 このアルゴリズムの操作の説明は次のとおりです。 この定式化について私が持っているいくつかの質問があります、そして私は答えをどこに見つけるかわかりません: (2)このアルゴリズムは、ある値でスケーリングされるDCTを生成することを示唆しています C=2–√C=2C = \sqrt{2}。これは、CCCDC係数の計算における乗算を回避するために、任意に選択されました。本当に唯一の要件はCD CT∗C私D CT=4N2CDCT∗C私DCT=4N2C_{DCT} * C_{IDCT} = \frac{4}{N^2}。だから私の質問はこれです:このアルゴリズムを使用した出力係数のスケーリング係数は何ですか?それらはDCTの元の定義とは異なるように見えますが、どの程度かはわかりません(主に、この図と元のDCTの定式化の間に実際に関係が見られないためです)。 F(k )=2 c (k )NΣn = 0N− 1f(n )cos((2 n + 1 ) πk2 N)F(k)=2c(k)NΣん=0N−1f(ん)cos⁡((2ん+1)πk2N) F(k) = \frac{2c(k)}{N}\sum_{n = 0}^{N - 1}f(n)\cos\left(\frac{\left(2n + 1\right)\pi k}{2N}\right) どこ c (k )=12√c(k)=12c(k) = \frac{1}{\sqrt{2}} …
7 dct 

3
コンピュータプログラミングにおける「ビット」の概念は、情報理論における「ビット」の概念と似ていますか?
今日まで、私は1ビットが変数、つまり1(高)または0(低)のいずれかの値を保持できるメモリ内のスペースであることを知っていました。これは、コンピュータプログラミング、マイクロプロセッサ、DATAバスなどを研究して学んだ概念です。 しかし、情報理論のコースを開始した後、ビットがメッセージ内のシンボルの情報内容として表現されていることがわかりました。これは、シンボルの出現確率の逆数の対数(底2)を使用して計算されます。 これら2つの概念は同じですか?一方、1ビットは、0または1を格納できる変数です。一方、1ビットは、発生確率が0.5の2つのシンボルの1つに関連する不確実性です。では、コンピュータプログラミングまたはASCIIコードの1ビットは、ソースの情報コンテンツまたは情報理論の1ビットを意味するのでしょうか。 少し編集します。ここで、このトピックを理解するときに問題が1つあります。英語のアルファベットのデータ転送では、ASCIIコードを使用する場合、基本的に各シンボルを8ビットで表します。それがaの場合は00000000、bの場合は00000001であるとします。したがって、基本的には、各シンボルに8つの量子化レベルを割り当てています。 ただし、情報理論が機能するようになると、各シンボルの確率が考慮されます。「E」は最高の頻度を持ち、「Z」は最低の頻度を持ちます。つまり、平均的な情報コンテンツは3ビットまたは4ビットに下ります。 私の本は、「エントロピーまたは平均情報コンテンツは、歪みのない各サンプルを表現するために必要な最小の平均ビット数です」と言います。この場合、効率的なデータ転送のために、各シンボルに対して最大4つの量子化レベルを作成していますか?なぜなら、平均して4ビットの情報を運ぶからです。もしそうなら、情報理論のビットは、コンピュータプログラミング、データ転送、ASCIIコードなどのビットと同じではありませんか? あなたはおそらく私がここで明らかにnoobであることを理解します:p

1
私たちの脳は常に聞き取るのを盗みますか?
私の理解から、私たちの耳は、私たちの聴覚範囲内の周波数で共鳴する蝸牛の毛/繊毛を持っています。これは、時間領域ではなく周波数領域で聞いていることを意味します。しかし、それは私たちがそれを処理するために常に音を盗んでいることを意味しますか?
7 fft  sound  ifft 

1
OFDMシンボルの末尾からのサンプルではなく、OFDMでゼロを使用してサイクリックプレフィックスを実行できますか?
x(0)x(1)x(2)x(3)x(4).... x(n-2)x(n-1)x(n)のOFDMシンボルを考慮します。サイクリックプレフィックスを実行するには、次のように、このOFDMシンボルの終わりからOFDMシンボルの始めにいくつかのサンプルをプレフィックスします x(n-3)x(n-2)x(n-1)x(n)x(0)x(1)x(2)x(3)........ x(n- 4)x(n-3)x(n-2)x(n-1)x(n)。 x(n-3)x(n-2)x(n-1)x(n)をとる代わりに、ゼロを前に付けるとどうなりますか?
7 ofdm 

1
フーリエ変換4回=元の関数(Bracewellの本から)
私は、フーリエ変換に関する優れた入門書である、ロナルド・ブレイスウェルによる「フーリエ変換とその応用」をざっと眺めていました。その中で、関数のFTを4回取ると、元の関数、つまりF(F(F(F(g(x )))))=g(x )。F(F(F(F(g(バツ)))))=g(バツ)。F\left( F\left( F\left( F\left( g(x) \right) \right) \right) \right) = g(x)\,. 誰かが私にこれがどのように可能であるかを親切に教えてもらえますか?上記のステートメントは複素数xに関するものであり、これは、、、、?私0= 1私0=1i^0=1私1= i私1=私i^1=i私2= − 1私2=−1i^2=-1私3= − i私3=−私i^3 = -i私4= 1私4=1i^4=1 啓発ありがとうございます。


2
表記と表記の違いは何
フーリエ変換とラプラス変換を理解しようとしています。と表記の違いは何 ですか?X(jω)X(jω)X(j\omega)X(ω)X(ω)X(\omega) 意味は何ですか?頻度を表すものですか?もしそうなら、虚数周波数の意味は何ですか?jωjωj\omega 前もって感謝します。

1
ノイズはどのように良いのでしょうか?
(制御された)ノイズは、画像にディザリングしたり、オーディオに柔らかな音をしたり、ホワイトノイズだけの場合もあるようです。これは、検出能を向上させるノイズに関する論文です。私の直感はまた、金融取引アルゴリズムのノイズが一種のヘッジとして機能する可能性があると述べています。 私にはいくつかの例があります—漠然とした哲学的な本能だけです。なぜ、どのようにノイズが良いのかについての一般的な文献や理論はありますか?または他の/より良い例?
7 noise 

3
arcsinアルゴリズムを探す
誰かが適度に正確なアークサインを計算するための単純なアルゴリズムを持っていますか?「シンプル」とは、出力サンプルごとに5回以下の乗算を必要とするある種の多項式を意味します。「合理的に正確」とは、入力引数がプラスまたはマイナス1に近いときにエラーが10%以下のアルゴを意味します。しばらくウェブを検索しましたが、すぐに役立つものは何も見つかりませんでした。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.