信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

2
最短のインパルス応答が得られるバンドパスフィルターの設計
中心周波数が500 Hz、帯域幅が1オクターブの単純な2次IIRバンドパスバターワースフィルターを設計すると、次の周波数応答が得られます... ここで、インパルス応答を取得して正規化し、dBに変換すると、インパルス応答の減衰が観察できます。 インパルス応答の減衰は、このスケールでプロットした場合、時間に対してほぼ線形であり、減衰時間の統計を定義できます(リバーブ時間を定義できる室内音響のように)。このフィルターのインパルス応答が30 dBを下回るには、約11 msかかります。 この減衰時間を最小限に抑えて、次の定数を維持しようとしています。 -3 dBの帯域幅 フィルター次数 通過帯域と阻止帯域のリップルを(制限内で)受け入れ、および/またはこれを達成するための遷移帯域の急峻性の妥協点を受け入れます。上記で定義した最短インパルス応答時間でフィルタリングする方法を提案できる人はいますか?

2
エッジ検出器によって検出されたエッジの接続
キャニーエッジ検出器から取得したバイナリイメージがあります。エッジは中央でうまく検出されないので、それらを結合する必要があります。エッジの接続は方向と近傍に依存します。しきい値(5ピクセル未満の距離など)を下回る場合は、頂点を接続する必要があります。私のほぼ線形の特徴がうまく方向付けられている場合、このしきい値を緩和する必要があります。(これが最良のケースです。) ハフ変換を試してみましたが、直線がないのでうまくいきませんでした。膨張と収縮も良くありません。彼らは画像をより面倒にします。 私が試みているアプローチは、最初に頂点とノードを検出し(MATLABでbwmorph)、その後、別の機能として葉を作成します。これは次のように行われます。 3x3ウィンドウでスキャンし、隣人を探します。 接続されたオブジェクト全体をトラバースします。 線(または2次多項式)を近似しようとします。 接続する価値があるかどうかは、機能ごとに確認してください。 頂点を接続する必要がある意思決定の部分は難しいため、実装は簡単ではありません。

1
MUSICを介して固有ベクトルを使用して信号の基本周波数を推定する方法について
環境: (免責事項:これは通信の問題ではありません)。 実際の周期信号の基本周波数を推定しようとしています。この信号は、生信号とパルスの信号を一致フィルタリングすることにより作成されました。(マッチドフィルター)。結果の信号には、次の特性があります。 定期的です。(基本は1 /期間)、これは私が推定しようとしているものです。 時間的には非定常です。具体的には、周期的パルスの振幅は振幅が異なります。(例えば、あるパルスが低く、別のパルスが高く、次のパルスが再び低く、その媒体の後に続くなど)。 私は、周波数が変化しないことを信じています(変化する振幅を受け入れますが、変化する帯域は受け入れません)。 高調波歪みがあります。ここで私が意味しているのは、(間違っている場合は修正してください)、しかし、信号内の個々のパルスは正弦波ではなく、ガウス、三角形のような、半放物線などの「ファンキーな」形状です。 この信号の基本周波数を推定しようとしています。 もちろん、生の信号はノイズに過ぎない場合もありますが、それでもパスを通過し、とにかく一致フィルター処理されます。(これについては後で説明します)。 私が試したもの: 今、私は次のような多数の基本周波数推定量を知っています。 自己相関法 YIN、およびそのすべての依存関係 FFTメソッド。 等、 YIN:YINはまだ試していません。 FFT方式:FFT方式は、すべての高調波と基本波を提供しますが、基本波は常に最高のピークではないため、特にこの非定常的なビジネスでは細心の注意を払う必要があることに気付きました。非常に迅速に、多くのピークのどれが基本であるかを確認しようとしていることに気づき、それは難しい問題になります。 自己相関:自己相関法はFFT法よりも優れているようですが、それでも時間領域信号の振幅の不規則性に敏感です。自己相関法は、中心ローブから次に高いローブまでの距離を測定します。その距離は基本に対応します。ただし、非定常の場合、このセカンダリローブは非常に低くなる可能性があり、しきい値設定スキームで見落とす可能性があります。 その後、MUSICのような部分空間法を使用して基本波を推定できる可能性があることに気付きました。これをテストすると、信号の基本波に対応する周波数で、非常に優れた結果が得られることがわかりました。(探している信号の数を2に設定すると、基本波が取得されます。つまり、信号の共分散行列の(固有値の最大値に対応する)最も高い2つの固有ベクトルが選択され、破棄され、残りの部分空間からノイズ部分空間を作成し、それらに対して複合複素正弦波を投影し、逆数を取得し、素敵な擬似スペクトルを作成します)。 質問と問題: そうは言っても、なぜこれがうまくいくのかを理解したいと思います。 MUSICでは、信号部分空間を破棄し、雑音部分空間を使用します。信号部分空間の固有ベクトルは、実際にはある種の「最適な」ものであるように思えます-実際、それらは最適な整合フィルターです。だから、なぜ信号部分空間固有ベクトルを直接使用しないのですか?(私はもう音楽ではないことを知っていますが、なぜノイズ部分空間を使用するのが良いですか?) 最後に、最後の問題は、この方法が非定常信号(上記で定義)に対してはるかに堅牢に動作するように見えますが、問題は、システムにノイズしか存在しない場合でも、常に答えが得られることです!(前に述べたように、事前にフィルター処理された生のフィルター処理された信号は、周期的な信号が存在しない場合にホワイトノイズになることがあります)。 これに対抗するにはどのような方法がありますか?固有値を調べてみましたが、信号が存在する場合とノイズが存在する場合の減衰には、より多くの「曲率」がありますが、十分に堅牢でない可能性があります。 ボーナス: 共分散行列の固有ベクトル対他の何かはいつですか?それらが正弦波であるかどうかを決定するものは何ですか?なぜ方形波ではないのですか?または、ここに他の形状の信号を挿入しますか?

5
音声のみの録音で歌が始まる場所を特定する
ユーザーが4行の歌を歌う小さなカラオケスタイルのアプリがあり、各行の間に1秒のギャップがあります。バッキングミュージックはないので、音声のみで、問題を解決しやすくすることを願っています。 私は、録音のどこでユーザーが1行目の歌唱を開始および終了し、2行目の歌唱を開始および終了するかを正確に検出する最も堅牢な方法を探しています。 私は、録音中にバックグラウンドノイズがほとんどない場合(それが発生する場合など)に機能する単純なアルゴリズムを組み合わせましたが、最小のノイズが存在する場合はバラバラになります。 誰かが私をもっと堅牢なものに向けることができますか?

2
描かれた漢字をストロークアニメーションのデータベースに一致させる方法
中国語の文字ストロークアニメーションのデータベースがあります。各エントリは基本的に、文字を描画する方法と順序を示すポイントのセットです。 ルックアップを簡単にするために、ユーザーがマウスで文字を手動で描画できるようにしたいと思います。それから、私のソフトウェアは(iPhoneで行われたように)いくつかの可能な一致を提案します。 Googleで検索しましたが、関連するものは見つかりませんでした。どのアルゴリズムまたは研究論文を見る必要があるかを知りたい。形状(中国語の文字)が描画される順序も関連していることを除いて、形状認識と関係があると思います。なにか提案を?

2
フィルタリングと多項式回帰平滑化の違いは?
古典的なローパスフィルタリング(IIRまたはFIRを使用)と、局所化されたN次多項式回帰および/または補間(アップサンプリングの場合)による「平滑化」、特にNが1より大きい場合の違いただし、回帰近似で使用されるローカルのポイント数よりも少ない。


4
基本的なhsb皮膚検出、ネオン照明
これが適切な質問の場所であることを願っています。それ以外の場合は私の間違いとすみません、より良いサイトを教えてください。 ある範囲のhsb画像を使用して、非常にシンプルな肌検出器を実装しようとしています。私はこことここで説明されているアプローチを使用しています。 ウェブカメラのビデオソースを使用しようとしています。私は太陽の照明を使用する場合、それは非常にうまく機能します(それほど良くはありませんが、かなり良い)が、ネオンの光で..それは混乱です。多くの白い領域が検出され、多くの場所でノイズが発生します。 どうして? 私は2番目のソースで説明されているアルゴリズムを使用しています: 画像をHSV色空間に変換する 0 <H <38の範囲に白を置く 拡張フィルター 侵食フィルター ぼかしフィルター

1
2D点群における円(楕円)の検出
すなわちポイント(2D)のセットを考えると、点群(PC)は、質問はについてですrobust、accurateそしてcomputing-friendlyこの方法は、(高度なバージョンまたは楕円)の円を見つけること。 直感的なアイデアは、可能な限りすべてのポイント(中心として){無限!}および半径(再び無限!)でブルートフォース検索を使用することです。これは非常に遅く、非効率的です。 以下に示すように、各適合円はnn、しきい値より短い距離で円周上に配置されたポイントの数()に基づいてランク付けされます(t)。したがってderr、平均距離を提示する必要があります。 高度な形式では、楕円が適合します。 アイデア、ブレインストーミング、経験、コメントはありますか?

1
バイナリロバスト独立基本機能(「BRIEF」)の理解
Briefアルゴリズムの記述子はどのように相互に一致しますか? テンプレート画像は別の画像でどのように見つかりますか?記述子をどのように比較しますか?私はその記事を読みましたが、彼らがそれをどのように行ったか理解していませんでした。 彼らは、ハミング距離を使用して記述子を比較したと書いていますが、照明、サイズなどの変化に対する不変性はどのように達成されますか?

4
ICA-共分散行列の統計的独立性と固有値
現在、Matlabを使用してさまざまな信号を作成し、混合行列Aで乗算して混合し、FastICAを使用して元の信号を取得しようとしています。 これまでのところ、元の信号と比較した場合、復元された信号は本当に悪いものでした。 私は何か間違ったことをしているかどうかを確認しようとしています。私が生成している信号は次のとおりです。 s1 = (-x.^2 + 100*x + 500) / 3000; % quadratic s2 = exp(-x / 10); % -ve exponential s3 = (sin(x)+ 1) * 0.5; % sine s4 = 0.5 + 0.1 * randn(size(x, 2), 1); % gaussian s5 = (sawtooth(x, 0.75)+ 1) * 0.5; % sawtooth …

2
数式を変更して、あらゆる角度でバーコードを検出するにはどうすればよいですか?-MATLAB
数式を変更して、あらゆる角度でバーコードを検出するにはどうすればよいですか? rgb = imread('barcode4.jpg'); % Resize Image rgb = imresize(rgb,0.33); figure(),imshow(rgb); % Convert from RGB to Gray Igray = double(rgb2gray(rgb)); % Calculate the Gradients [dIx, dIy] = gradient(Igray); B = abs(dIx) - abs(dIy); % Low-Pass Filtering H = fspecial('gaussian', 20, 10); C = imfilter(B, H); C = imclearborder(C); figure(),imagesc(C);colorbar

1
なぜ
私はこれがシンプルだが悪いローパスフィルターであることを発見しました: y(n )= x (n )+ x (n − 1 )y(n)=x(n)+x(n−1)y(n) = x(n) + x(n-1) ただし、なぜローパスフィルターなのか理解できません。そのカットオフ周波数は何ですか?

2
ECG画像から信号を復元する方法
私のプロジェクトでは、通常のカメラ(jpeg)で撮影したECG画像をデジタル化する必要があります。たとえば、次のカメラキャプチャ画像があります。 そして、私はこのようなものを取得したい:- そして、ECGのデジタル化に関するこのビデオのように、デジタル化されたデータ(x、yポイント) どうすればいいかわからないので、いくつかの研究論文を検索して相談しました。アルゴリズムの一般的なアプローチは次のとおりです。 グレーレベル画像に変更 グリッド線を削除する 欠落点を追加する 2D画像を1D画像に変換する 2番目のポイント、つまり、グリッド線の削除に固執しています。これを行うためにいくつかの参考文献を調べたところ、ヒストグラム分析が役立つ可能性があります。 これを行う方法を教えてください(MATLAB 2010を使用しています)?任意の助けをいただければ幸いです。

1
フィルター設計のための遺伝的または進化的アルゴリズム?
どのようなタイプのフィルター設計問題に対して、遺伝的アルゴリズムまたは進化的アルゴリズムが役立つでしょうか? DSPの問題には、どのような遺伝的または進化的アルゴリズムが使用されますか? 編集:質問を拡張して、微分進化などのより大きな進化アルゴリズムのセットを含めました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.