信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

1
の最適な振幅
ゼロからピークまでの実振幅の連続時間正弦波 A≤2m−1−0.5A≤2m−1−0.5A \le 2^{m-1}-0.5 (例えば、 m=16m=16m=16、 A≤32767.5A≤32767.5A \le 32767.5)は mmm最も近い整数に丸めることによる1ビットの解像度(図1)。異なるための最適な振幅は何ですかm≤24m≤24m \le 24? 図1。 m=4m=4m = 4、最大許容振幅の正弦波 A=7.5A=7.5A = 7.5 (青い実線)、その量子化(オレンジ色の破線)、最も負および正の4ビットの2の補数の符号付き整数-8および7(黄色)。 最適性の2つの代替定義のそれぞれについて回答が必要です。 信号対ノイズ比(SNR)を最大化します。ここで、信号は元の正弦波であり、ノイズは量子化誤差です。 量子化された正弦波のフーリエ級数の基本周波数の振幅に対して正規化された全高調波歪み(THD)を最小化します。

3
パワー信号としてのランダム信号
ランダム信号がパワー信号(つまり、無限のエネルギーと有限の平均パワーを持つ信号)と見なされるのはなぜですか? これは意味がありますか?現実の信号(通常は固有のランダム性がある信号)には有限のエネルギーがあることはわかっていますが、ランダムな信号が無限のエネルギーを持っているとはどういう意味ですか?

2
フィルタリング-周波数領域での乗算
単純なローパスフィルターを作成しようとしていますが、単純なバターワースフィルターの周波数応答を見て、驚くべき結果が得られました。 この他の投稿から以下の例の多くをコピーしました。スクリプトの下部にコードを追加して、入力と出力のスペクトルをフィルターの周波数応答と比較します。出力スペクトルがBB\mathbf B 入力スペクトルの積でなければなりません AA\mathbf A と周波数応答 HH\mathbf H: B=HAB=HA \mathbf B = \mathbf H \mathbf A ただし、下のプロットは、フィルターが実際に一部の低周波成分を増加させていることを示しています。赤い線が下の緑の上にある様子を確認してください 4 Hz4 Hz4\textrm{ Hz}。 これがなぜであるか誰でも説明できますか? import numpy as np from scipy.signal import butter, lfilter, freqz import matplotlib.pyplot as plt from scipy.fftpack import fft as fft def butter_lowpass(cutoff, fs, order=5): nyq = 0.5 …


1
適応フィルタリング:最適なフィルター長と遅延
RLSアルゴリズムを使用して、適応フィルタリングの最適なフィルター長を見つけようとしています。 私はこのデザインを使用しています: つまり、「エラー」信号はノイズのない信号です(それが私が欲しい信号です)。 私が持っている場合はが、、私は私の希望信号必要されるだから用いて最適フィルタ長(及び遅延)を見つけますMSE基準ですが、今はエラーとして必要な信号があるので、最適なフィルター長を見つける方法がわかりません。出力でMSEが何を取得する必要があるかわからないためです。e(n)=d(n)−y(n)e(n)=d(n)−y(n)e(n) = d(n)-y(n)d(n)d(n)d(n)e(n)→0e(n)→0e(n) \rightarrow 0 誰か私に何をすべきか教えてもらえますか? ありがとう!

1
ホワイトノイズDC成分
私はDSPを初めて使用するのですが、実際にはコンピュータサイエンスを勉強しており、DSPを選択科目として採用しているため、私の知識はかなり限られています。 私は純粋なことを学んできた白色雑音信号 、それが非ゼロで持つように、それはまた、ゼロ周波数を有することを意味すること、例えば、すべての可能な周波数を持つ直流(?それそれがどういう意味)コンポーネントはなく、定義することにより、純粋なホワイトノイズはゼロ平均を持っており、したがって、DC成分はゼロです。 何が欠けていますか? ありがとう!

1
一連のMFCCベクトルの正しいグラフィック解釈は何ですか?
私は音声認識、特に特徴抽出のためのMFCCの使用について研究しています。オンラインで見つけたすべての例は、特定の発話から抽出された一連のMFCCを次のようにグラフ化する傾向があります(私が作成しているソフトウェアから私が生成したグラフ)。 上のグラフからわかるように、 x軸は、(この例では12に1から)MFC係数のそれぞれのために使用されます y軸は、(この例ではおよそ10mlの液体フッ化水素を圧入-12から42の範囲)係数の値のために使用されます あなたは持っているフレームなど多くの行として、またはあなたが抽出されている特徴ベクトル(この例では140)。 ここで見ているのは、すべての特徴ベクトルを一度に重ね合わせたため、時間情報が失われているためです。この表現がどのように役立つかを理解するのに苦労しています。 私の考えでは、抽出したベクトルを次のように表現します(ここでも、私が生成したグラフです)。 上のグラフでは: x軸はフレームまたはベクトル数(1 140)に y軸(-12から42およそ10mlの液体フッ化水素を圧入し、再び)係数値であります あなたは持っている機能ごとに1行(12)。 私にとって、この表現は、特定の各機能の時間的変化を見ることができ、音声アルゴリズムに比較アルゴリズムを適用する方法により強い影響を与えるはずなので、より役立つはずです。 おそらく、2つの表現は等しく有効であり、さまざまな目的に役立ちます。時間領域または周波数領域で信号を調べる必要がある場合と同様ですが、音声認識の場合、各個人の時間の変化を予測します。機能は、各機能の値の密度よりも意味のあるものにしてください(おそらく私は完全に間違っています:P)。 したがって、実際には2つの質問があります。 なぜ最初の表現が広く使われているように見え、2番目の表現ではないのですか? たとえば、動的タイムワーピング-DTWを使用して、このトピックに関連する、抽出されたMFCCの2つのセットを比較する場合、特徴ベクトル(つまり、12特徴の140ベクトル)またはフレーム(140フレームの12ベクトル)を比較しますか? )?(つまり、MxNまたはNxM?) ありがとう!

2
ゼロ位相フィルター:前方後方フィルタリングの初期条件の決定
フォワードバックワードフィルタリングで過渡を最小化するためのGustafsonのアルゴリズムに精通している人はいますか[1]?私はそれを実装しようとしていますが、私の最初の推測は、Matlabのfiltfilt.mをチェックすることでした。Matlab関数では、起動過渡を最小化する初期条件ziを見つけるために線形方程式系も解かれますが、参照とコードの関係は私には明らかではありません。最小化に関するコードの行は次のとおりです(nfiltは係数ベクトルの長さです): zi = ( eye(nfilt-1) - [-a(2:nfilt), [eye(nfilt-2); zeros(1,nfilt-2)]] ) \... ( b(2:nfilt) - b(1)*a(2:nfilt) ); それらの行がGustafsonの記事で説明されているアルゴリズムとどのように関連しているかについて、誰かが正しい方向に私を指摘できますか? [1] Gustafsson、F。「フォワードバックワードフィルタリングでの初期状態の決定」信号処理に関するIEEE®トランザクション。巻。44、1996年4月、988〜992ページ。

1
GFTへのFFTの送信が計算上価値がある場合の良いヒューリスティックポイント?
これはかなり単純な質問ですが、GPUとCPUでFFTを計算するための良い経験則に関して、過去5年ほどの間に投稿されたものはあまりありません。GPUで計算されたFFTのオーバーヘッドのほとんどは、変換を計算するために、最初にデータをバッファーに書き込んでから、そのデータをCPUからGPUに送信する必要があることです。 これは当然、FPUのGPU計算は、GPUが実行する計算の数と比較してGPUへの書き込みの数が比較的少ない、より大きなFFT計算により適していることを意味します。しかし、問題は、FFTがCPUとGPUでどちらのパフォーマンスが優れているかを知ることになります。私が見つけた最高のものは「より大きなFFTを計算しているとき」という行ですが、特にGPUテクノロジーがここ数年で非常に急速に加速していることを考えると、実務家にとって特に意味のあるガイドラインになるのは少し相対論的です。 私は、GPUとCPUの変換を計算することがどの時点で効率的になるかについてのより具体的な見積もりを探しています(おそらくどこかにベンチマークがありますか?)。あなたが提供できるあらゆる助けを事前に感謝します。
7 fft 

2
この信号は完全に再構築可能ですか?
質問は次のとおりです。 分析させてください: 最初の下り道: バツ1(z)バツ2(z)バツ3(z)バツ4(z)=z− 1バツ(z)=12{バツ1(z12) +バツ1( −z12) }=バツ2(z2)=12{バツ1(z) +バツ1(− z)} =12{z− 1バツ(z)−z− 1バツ(− z) }= zバツ3(z)=12{ X(z)− X(− z) }X1(z)=z−1X(z)X2(z)=12{X1(z12)+X1(−z12)}X3(z)=X2(z2)=12{X1(z)+X1(−z)}=12{z−1X(z)−z−1X(−z)}X4(z)=zX3(z)=12{X(z)−X(−z)}\begin{align} X_1(z) &= z^{-1}X(z)\\ X_2(z) &= \frac{1}{2}\left\{X_1\left(z^\frac{1}{2}\right)+X_1\left(-z^\frac{1}{2}\right)\right\}\\ X_3(z) &= X_2(z^2) = \frac{1}{2}\left\{X_1(z)+X_1(-z)\} = \frac{1}{2}\{z^{-1}X(z)- z^{-1}X(-z)\right\}\\ X_4(z) &= zX_3(z) = \frac{1}{2}\left\{X(z)- X(-z)\right\} \end{align} そしてアップロード: バツ6(z)=バツ5(z2)=12{ X(z)+ X(− z) }X6(z)=X5(z2)=12{X(z)+X(−z)} X_6(z) = X_5(z^2) …

2
テレビ放送の高いオーディオ周波数
テレビ放送でハイエンドのオーディオ周波数、たとえば14 kHzより高い周波数が送信されるかどうか知りたい。テレビ放送の送信のカットオフ周波数はどのくらいですか? 私は、iPhone、Samsung Galaxies、さまざまなテレビなどのさまざまなデバイスのオーディオ周波数応答を特徴付けるレポート(研究用)を準備しています。これをしている間に、私はテレビのスペクトル出力に興味を持ちました。ブロードキャスト送信用のオーディオを考えると、スペクトルはどのように変更されますか?どのような周波数でカットオフがあり、特にカットオフは人間の可聴範囲である〜20Kを下回ることがありますか? おおむね私の興味は、放送チャンネルに与えられたオーディオがどうなるか、そしてそれがテレビへの入力として到着するまでに何が起こるかを知ることです。 ありがとう。
7 audio 

2
MP3エンコードアルゴリズムに関する参考資料
誰かがMP3アルゴリズムを段階的に説明し、明確に理解できるリファレンスがありますか? これらの参照は少し混乱しました: 修正離散コサイン変換を使用したオーディオ圧縮、MP3コーディング標準、Joebert S. Jacaba、2001 Theory Behind Mp3、Rassol Raissi、2002 手順を完全に理解するために、手動で紹介したリファレンスを読んだ後、ビットストリームをMP3にエンコードします。

2
離散フーリエ変換(DFT)の大きさの補間
たとえば、ピーク周波数の検出では、複素数のDFTビンで、またはそれらの実数部と虚数部で別々に帯域制限内挿法を使用し、結果の大きさまたは2乗した大きさを計算することは有効であると思われます。しかし、ビンの大きさ(それは妥当ではないと思います)、またはそれらの二乗された大きさ(多分妥当)の帯域制限補間についてはどうですか?妥当とは、完全に補間された値は、時間領域信号のゼロパディングされたバージョンのより大きなDFTからそれらを計算することによって検出された値と等しくなることを意味します。 最初のアプローチは、補間が完全でない場合の他のアプローチとは異なり、非負の結果を保証します。非負または正の帯域制限補間に関するこの質問を参照してください。

1
一致したフィルターの場所
デジタル通信受信機では、マッチドフィルター(SRRCフィルター)を使用しています。さまざまな文献で、マッチドフィルターの場所は2つの異なる場所で言及されています。1つは、ADCの直後にタイミング回復システムのリサンプラが続き、もう1つは、タイミング回復プロセスのリサンプラの後にタイミングエラー検出器(TED)が続くところです。 私の理解では、実際にはリサンプラーの後でなければなりません。補間係数は444 送信機側では、つまり 444シンボルごとのサンプル。したがって、シンボルレートが2 MHz2 MHz2\textrm{ MHz}、サンプルレートは 8 MHz8 MHz8\textrm{ MHz}。 さて、受信機側で、私が使用しているADCが 40 MSps40 MSps40\textrm{ MSps} つまり、サンプルレートは 40 MHz40 MHz40\textrm{ MHz}、これは 202020 シンボルレートの倍数、または 555トランスミッタのサンプルレートを掛けます。オリジナルのトランスミッタサンプリングレートに戻るのは、リサンプリング後のみです。そのため、SRRCフィルター(オーバーサンプリングレート444)を採用することができます。それ以外の場合、リサンプラーの前に使用する場合は、SRRCフィルターを使用する必要があります(オーバーサンプリングレート202020)。これにより、フィルター係数の数が増加し、ハードウェアコストが増加します。 私の理解は正しいですか?

3
負のSNRを伴う音響シナリオ
そこにいるすべての練習エンジニアのために: どこで負のSNRに遭遇しましたか? dBでどのくらい負の値でしたか、それとも推定されましたか? どこで負のSNRに遭遇すると思いますか? 注:干渉信号もノイズとしてカウントしているため、SNRにはSIRを含めることもできます。 私自身の経験では、カーコミュニケーションに負のSNRが見られました。ロードノイズ、マルチトーカー、音楽の干渉があります。携帯電話からの出力でも見ました。風雑音は時々そこに重大な問題を引き起こすかもしれません、同様にスピーカーフォンモードで無数の干渉を引き起こします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.