信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

1
画像のリサンプリング前にローパスフィルタリングを行う際のガウスカーネルパラメーターの選択?
信号をqの係数で間引きする必要があります。 より具体的には、私の信号は3D「画像」です。 I(xi,yj,zk) I(xi,yj,zk)\ I(x_i,y_j,z_k)、これをz方向に2倍ダウンサンプリングする必要があります。 サイズnのガウスカーネルでたたみ込むことにより、デシメーションの前にローパスフィルタリングを実行したいと思います。 ガウスカーネルは、分布の95%を占めるため、0の上下に2標準偏差を作成します。 私はnの大きさを教えてくれる経験則を探しています。 ガウシアンはfN / qを超えるすべての周波数をフィルターで除去する必要があると私は考えていますか?ここで、fN:元の信号のナイキスト周波数? 標準偏差のガウスのフーリエ σ σ\ \sigma 標準偏差を持つ別のガウス σ∗= 1 / σ σ∗=1/σ\ \sigma^* =1/\sigma 。ローパスフィルターがどれほど厳密であるかわかりません。カット周波数fcは2または3の標準偏差にする必要がありますか? 次に、サイズnのガウスカーネルのカット周波数fcの式は何ですか?fc(n)=? 以下は、Matlabで計算されたいくつかのガウスカーネルの周波数応答です。 私の実際の問題にはq = 2が関係しており、この図から、n = 5がうまく機能することがわかります。経験則があれば良かったので、遭遇するqごとにこれを行う必要はありませんでした。

1
PythonでGoertzelアルゴリズムを実装できませんでした
stackoverflowについて質問した後、PythonでGoertzelアルゴリズムを実装しようとしました。しかし、それは動作しません:https : //gist.github.com/4128537 import math def goertzel(samples, sample_rate, f_start, f_end): """ Implementation of the Goertzel algorithm, useful for calculating individual terms of a discrete Fourier transform. """ window_size = len(samples) f_step = sample_rate / float(window_size) # Calculate which DFT bins we'll have to compute k_start = int(math.ceil(f_start / f_step)) k_end …
7 fft  dft  python 


2
消える瞬間
私はアントワーヌ他による「二次元ウェーブレットとその親族」というタイトルの本を読んでいます。そして、それは消える瞬間について話します。その正確な意味を理解するのに苦労しています。誰もが消える瞬間についてアイデアを与えることができますか?
7 wavelet 

3
特定のパルス長が与えられた場合、理想的なFIR長はどのくらいですか?
フィルター処理しようとしているノイズのあるウィンドウ処理された正弦波のパルス長を考慮して、「理想的な」FIRフィルターの長さを確認しようとしています。TpTpT_p 私が設計するFIRフィルターへのパラメーターとして、私は以下を持っています。 Fc=15 kHzFc=15 kHzF_c = 15 \text{ kHz}、中心周波数。(これは信号のキャリア周波数です)。私はこれを知っている。 これはBPF FIRなので、通過帯域をからます。これは、ウィンドウ処理された正弦波の帯域幅がFc−1TpFc−1TpF_{c} - \frac{1}{T_p}Fc+1TpFc+1TpF_{c} + \frac{1}{T_p}2Tp2Tp\frac{2}{T_p} 正確にどのように正確にわからない最後のパラメーターは、このFIRの長さです...これは私が失われるところです。ここでの理想的な長さ(ある場合)は...パルスの長さ(もちろんサンプル数)だけにする必要があります。これにより、一致したフィルターに似たものになりますか?これは、フィルター長を長くしてもそれ以上の利益がないことを意味しますか? さらなるコンテキストとして、私はこの「理想的な」長さを求めています。それは、存在する場合、できるだけ多くのノイズを除去しようとしているだけでなく、鋭いトランジェントを維持するためにも最善を尽くしています。これは私が尋ねるようになったものです、最初から理想的なフィルター長はありますか?たとえば、次のプロットでは、信号の長さ11(赤)と長さ171(黒)のフィルターを使用して、信号のノイズバージョンをフィルター処理しています。それらを以下に示します。 ご覧のように、黒い結果は「より滑らか」ですが、トランジェントの範囲では、より「汚れ」ていることがわかります。対照的に、赤はまだいくらかのノイズを保持していますが、トランジェントはそれほど影響を受けていません。 以下のプロットは、上記のフィルターのスペクトルを示しています。 TLDR:では、FIRフィルターに「理想的な」長さはありますか?フィルターの長さをさらに長くしても、ノイズ耐性は失われませんが、トランジェントが必要以上にスミアになる可能性がありますか? 編集: 新しい画像を2つ追加しました。最初のフィルターには、長さ11のフィルター(赤)、長さ171のフィルター(黒)、長さ901のフィルター(青)があります。濃い青はデータのスペクトルです。 長さ11のフィルター(赤)と長さ901の新しいフィルター(黒)の対応する結果を次に示します。

1
画像から影を取り除く
画像からブドウのみを抽出したい。残念ながら、時々私はブドウを正確に手に入れません。 すべてのケースでうまく機能しないコードがあります。時々、それは影とブドウを区別しません。 入力画像の例: 私が得ている結果: そしてこれは私のコードです: RGB = imread('DSC02807.JPG'); GRAY = rgb2gray(RGB); threshold = graythresh(GRAY); originalImage = im2bw(GRAY, threshold); originalImage = bwareaopen(originalImage,250); SE = strel('disk',10); IM2 = imclose(originalImage,SE); originalImage = IM2; imshow(originalImage);

1
デジタルバイカッドフィルター
デジタルバイクアッドフィルターの係数を計算するための唯一の「信頼できる」Web参照(=非常に頻繁にリンクされます)は次のようです。 http://www.musicdsp.org/files/Audio-EQ-Cookbook.txt パラメータQ、BW、dbGainの役割と使用法を説明する適切なリファレンスまたはチュートリアルがあるかどうか、誰かが知っていますか? たとえば、仕様でBWの代わりにQを使用するとどうなりますか?Qの意味は何ですか?私が見るところ、それは通過帯域フィルターの帯域幅(どの単位で?Hzまたは正規化周波数?)に関連していますが、おそらく私は間違っています。そうでない場合、それらはどのように関連していますか? いつどのようにしてdbGainパラメータを指定する必要がありますか?上記の式でバンドパスフィルターを作成すると、f0付近よりも高いゲインが得られます。ユニタリーゲインを得るために、a、b係数を正しくスケーリングする方法は? 帯域幅(BW)とQ仕様に関するその他の興味深い情報 http://www.rane.com/note170.html 回答後に編集 私が見ると、Qの効果の1つは中心周波数の選択度を上げることです。そのため、Qが高いバイカッドバンドパスは、中心周波数が低い方のバイカッドバンドパスよりも中心から外れた周波数を大幅にカットするバイカッドよりも選択性が高くなります。しかし、この例では、周波数1000および3000 Hzの交番正弦波をもつ信号があります(FSは44100)。 Q = 2のバンドパスを使用して3000 hzを中心にフィルタリングすると、バンドストップにリップルがほとんどない非常に良い信号が得られます(バンドパスバイクアッド係数:b = [0.0939、0、-0.0939]、a = [1.0、-1.6492 、0.8122]) そこで、リップルを下げるためにQを最大20に上げることにしましたが、これだけです!(帯域通過双二次係数:b = [0.0103、0、-0.0103]、a = [1.0、-1.8014、0.9795]) Q = 20のバイカッドバンドパスは、バンドストップの周波数をカットオフするのではなく上げるように見えるのはなぜですか。また、中心周波数がさらに広がるのはなぜですか。なぜそれは私の信号をよりシャープにしないのですか?これらの問題を軽減する方法はありますか? 助けてくれてありがとう !
7 biquad 

1
この方程式はどのように平滑化に対応していますか?
データの平滑化について教えてください。これは、ここに投稿された私の以前の質問のフォローアップです。特に、関数を平滑化する方法を彼が言っているJunuxxによるトップの回答は次のとおりです。f(x )f(x)f(x) f』[ t ] = 0.1 f[ t − 1 ] + 0.8 f[ t ] + 0.1 f[ t + 1 ]f′[t]=0.1f[t−1]+0.8f[t]+0.1f[t+1] f'[t] = 0.1 f[t-1] + 0.8 f[t] + 0.1 f[t+1] ここで、すべてのポイントについて、そのポイントとその2つの隣接ポイントの加重平均を取り、と呼ばれる平滑化バージョンを取得していることがわかります。f[ x ]f[x]f[x]f[ t ]f[t]f[t]f』[ t ]f′[t]f'[t] 音声強調に関する論文では、 y[ i ] = a [ i ] …

2
画像のコントラストを測定する
プロジェクトの場合、グローバルイメージのコントラストを測定したいと思います。 さまざまな画像を比較して、コントラストが最高の画像を取得したいと思います。ウェーバーのコントラストについて知っていますが、正規化されたコントラスト値(0〜1の範囲)が必要です。 openCVでこれを行う簡単な方法はありますか?

3
テストデータとトレーニングデータ
私はパターン認識と機械学習に関するビショップの本を読んでいます。導入セクションを通過すると、「テストデータ」と「トレーニングデータ」という2つの広く使用されている用語の違いを理解できるかどうかわかりません。トレーニングデータは、特徴抽出とも呼ばれる前処理段階の後に取得するデータですか?ここで、テストデータは元の入力です。私は正しいですか?


2
出力シーケンスは、インパルス応答、スケーリングされた信号、およびタイムシフトされた信号のコピーの合計とどのように等しくなりますか?
申し訳ありませんが、これは非常に基本的な質問です。しかし、私はそれがどのように可能であるか理解するのに苦労しています。 インパルス応答が、初期条件が0に設定された入力としてインパルスシーケンスが与えられたときのシステムの出力であることを知っています。 スケーリングは、信号の振幅を増やすことです。つまり、iに入力を2倍すると、出力も2倍になります。 時間シフトされた信号は、入力を遅延させると、出力も同じ係数で遅延します。 これで、シーケンスをインパルス応答、スケーリングされた信号、およびタイムシフトされた信号のコピーの合計に分解する方法の例を使用して、これを説明できますか? よろしくお願いします。

1
各ピクセル値を近傍の最も表現されたピクセル値に変換することを含むたたみ込み
グレースケール画像の背景の強度の段階的な変化を修正するために、ぼかし、畳み込み画像から元の画像を差し引いてきました。 場合によっては、ぼかしの代わりに中央値ぼかしを使用することで改善が見られました。 したがって、さらに進んでグレースケール画像を畳み込むフィルターを使用して、各ピクセルが長方形の近傍のヒストグラムで最も表現されたピクセル値の値を取ることができるかどうか疑問に思いました。 この畳み込みの名前を知っていますか? OpenCVの実装を知っていますか? どうもありがとうございました、

1
バイクアッドフィルターの振幅応答のプロット
バイクワッドフィルターを使用してマルチバンドオーディオEQを作成しました。RBJクックブックのメソッドを使用して係数を取得しています。 次に、振幅応答を示す曲線をプロットします。このソースからの方程式を使用しています これは、係数を取得し、関心のあるポイントでの振幅応答を取得するための関数です。 void GetCoefficients (double samplerate = 44100.0) { //from the rbj biquad coefficient cookbook by Robert Bristow-Johnson long double SR = (long double)samplerate; long double A = powl(10.0L, dBGain/40.0L); long double W0 = 2.0L * PI * Center / SR; long double alpha = sinl(W0)*sinhl( LN2/2.0L * WidthInOctaves …

1
ウィンドウ処理のコンテキストでの超解像とは何ですか?
DSP / DIPのコンテキストで、超解像とは何かを理解しようとしています。最大化/最小化されている基準とその理由 私のオンライン検索のほとんどは光学物理学の観点から超解像技術を生み出していますが、私はそれらが画像処理や一部のドップラーレーダー処理でも使用されていることを偶然に知っています。 私が覚えているSuper-Resの特定の例の1つは、メインローブがボックスカーの幅と同じ幅でありながら、ハミングウィンドウのようにサイドローブが非常に低く高速に低下するウィンドウ関数の設計でした。この意味で、「スーパー解像度」は、メインローブの幅が狭く、ダイナミックレンジが非常に高いため、互いに非常に近い周波数を解決できるという事実に由来しています。これは本当に超解像度と同じですか? (おそらく)それをノイズ除去やスパース性追求の形に例えているという説明はありますか?それともまったく別の動物ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.