信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

1
画像内の車両を数える
私は、画像内の車をうまく数えるアルゴリズムを実装しようとしています。交通画像に複数車両のオクルージョンがある場合の車両カウント方法の実装を試みました さまざまな画像のセットから背景を推定します。私はこの目的のために他のさまざまな手法を検討しましたが、これらすべての方法のいずれかで、画像のセットからの背景推定を使用するか、ビデオを必要とします。私は入力として、背景(おそらくほとんどの論文では道路)がほとんど見えない交通画像を持っています。さらに、画像は異なる領域のものなので、共通の背景もありません。その場合、どうすればよいですか? どういうわけか私が車(車)の構造を一致させることができれば、おそらくそれらを一致させることができると考えています。しかし、これが実現可能かどうか、また、画像には複数の遮蔽された車両が含まれているため、それがどのように進むかはわかりません。 ヒントや研究論文も大歓迎です。 サンプル画像は次のとおりです。

1
位置、速度、加速度のカルマンフィルターの実装
私は過去にカルマンフィルターをさまざまな目的で使用しましたが、スマートフォンアプリの位置追跡のコンテキストで位置、速度、加速度を追跡するために使用することに興味があります。これは単純な線形カルマンフィルターのテキストブックの例であるべきだと思いますが、これについて説明しているオンラインリンクを見つけることができません。私はこれを行うさまざまな方法を考えることができますが、ゼロから調査するのではなく、おそらくここの誰かが私を正しい方向に向けることができます。誰かがこのシステムをセットアップする最良の方法を知っていますか?たとえば、最近の位置観測の履歴を考えると、カルマンフィルター状態空間の次の点を予測する最良の方法は何ですか?状態空間に加速を含めることの利点と欠点は何ですか?すべての測定が位置である場合、速度と加速度が状態空間にあると、システムが不安定になる可能性がありますか?など...または、カルマンフィルターのこのアプリケーションの優れたリファレンスを知っている人はいますか?ありがとう

3
それ自体に時間遅延バージョンの信号を追加すると、フィルターされた信号が作成されるのはなぜですか?
私はこの質問を尋ねられ、周波数ドメインを含まないその場で答えを出すことができませんでした(基本的に、遅延シーケンスの係数はFIRフィルターのインパルス応答であるということです)。 このプロセスを「明白」にする洞察を誰かが持っていますか?
9 filters 

1
車両のセグメンテーションと追跡
私はしばらくの間、UAVからキャプチャされたビデオで車両を検出および追跡するプロジェクトに取り組んでいます。現在、車両および背景画像から抽出されたローカルフィーチャの機能のバッグ表現でトレーニングされたSVMを使用しています。次に、スライディングウィンドウ検出アプローチを使用して、画像内の車両の位置を特定し、追跡します。問題は、このアプローチははるかに遅く、私の検出器は私が望むほど信頼性が高くないため、Imがかなりの数の誤検知を取得することです。 したがって、分類器を適用する前に検索スペースを減らすために、車をバックグラウンドからセグメント化しておおよその位置を見つけることを検討してきましたが、これをどのように行うかわからず、誰かが助けてくれることを望んでいましたか? さらに、レイヤーを使用したモーションセグメンテーションについて読んでいます。オプティカルフローを使用してフローモデルでフレームをセグメント化しています。この方法の経験はありますか。この方法が当てはまるかどうかについて、何か意見があれば教えてください。私の問題。 更新:私はこの質問をスタックオーバーフローにも投稿しましたが、素晴らしい回答がありました。このアイデアはすでに実装されており、驚くほどうまく機能しており、この手法に加えてオプティカルフローを使用して調査しています。 以下は、サンプルビデオの2つのフレームです フレーム0: フレーム5:


1
エッジのノイズを除去(圧縮効果)
圧縮された漫画の画像があります。例: それらにはそのようなノイズがあり、削除するのは容易ではありません。 ピクセルが灰色の背景にある場合でも、ノイズピクセルは非常に異なる色になる可能性があり、そのような画像の(グレースケール画像の)ヒストグラムを見ると、メインカラーのビンの周りに多数のビンが見られます。ただし、重要な機能(目など)を削除するリスクがあるため、メインカラーではない値の色だけを削除することはできません。また、画像をポスタリゼーション化しようとしましたが(例では8色を表示しています)、一部のピクセルがまだ残っています。 また、メジアンフィルターを試しましたが、そのような重いノイズを消すことはできません(私は3 * 3フィルターを使用しています)。 この場合、ノイズを効果的に除去できる方法をいくつか教えてください。私はどんな助けにも感謝します!

2
DQPSKをソフトデコードする方法
シンボルと前のシンボルのコンスタレーション位置のドット積をとることで、D-BPSKをソフトデコードできました。結果が1以上の場合、シンボルの位相は変更されておらず、ビットはゼロです。結果が<= -1の場合、位相はシフトしており、結果は1です。-1と1の間の結果は、ソフト0またはソフト1です。 D-QPSKで同じことを行う方法がわかりません。フェーズのみを使用することもできますが、これにより、ソフトデコーダーに役立つ可能性のある多くの情報が破棄されます。 このペーパーでは、その方法を説明し、式(10)を示します。 b1=Re{sns∗n−1},b2=Im{sns∗n−1}b1=Re{snsn−1∗},b2=Im{snsn−1∗}b_1 = \mathrm{Re}\{s_n s^*_{n-1}\}, b_2 = \mathrm{Im}\{s_n s^*_{n-1}\} しかし、表記がわかりません*。上に浮かぶとはどういう意味ですか?複素数を掛けて実数部と虚数部をとるだけでうまくいきませんでした。 コンスタレーションは回転することができるので、2つの軸をどのように分離することができますか?

5
DSPの不安定なシステムの正確な意味は何ですか?
物理システムでは、安定性または不安定性の意味は何ですか。たとえば、正のフィードバックで動作する場合、オペアンプは飽和するか、発振を開始します(つまり、安定した状態になりません)。それは私には明らかです。 しかし、たとえばIIRフィルター(または他のデジタルシステム)が非常に不安定になる可能性があると言っているとき、私は正確に何を意味するのか理解できません。 Digital Signal Proccessorの内部では正確に何が起こり、出力では物理的にどうなりますか? この文脈での不安定なシステムとは正確にはどういう意味ですか?

1
3D画像の回転
等方性でないボクセルの3D画像を取得し、それに一般的な回転を適用しています。回転した画像の適切なボクセルサイズを決定するにはどうすればよいですか?情報の損失を最小限に抑える必要がありますが、画像が大きくなりすぎないようにするために、過度のスーパーサンプリングは避けてください。

1
DWTのスカログラム(および関連する用語)
スカログラムについての私の理解は、特定の行について、特定の変位でのウェーブレットによる入力信号の投影のスコアが表示されることです。行全体で同じことが当てはまりますが、ウェーブレットの拡張バージョンです。スカログラムは、すべてのタイプのウェーブレット変換、つまり次のものに対して定義できると思いました。 連続ウェーブレット変換 離散ウェーブレット変換 冗長ウェーブレット変換 ただし、さらに調査すると、スカログラムはCWTに対してのみ定義可能であるようです。これに基づいて、GoogleがATMに十分ではない複数の相互関連の質問があります。 質問: スカログラムがDWTまたはRWTに対して定義されていないのは本当ですか?もしそうなら、なぜでしょうか? 長さの信号がDWTを使用して10レベルの分解を持つとしましょう。すべてのレベルがイメージ(つまり、イメージ)としてプロットされる場合、このイメージは何と呼ばれますか?NNN10 × N10xN10xN DWTの「スカログラム」の例として、AWGNの例を次に示します。 同じ信号について、代わりにすべてのレベルでの信号の近似MRAをプロットするとします。(つまり、)画像。この画像は適切な用語で何と呼ばれていますか?たとえば、ここでは、AWGNの近似MRAと詳細MRAを示しました。(明らかに、それらはDWTの「スカログラム」と同じではありません)。10 × N10xN10xN ありがとう!

2
わかりやすい英語のデジタル画像の瞬間
私はOpenCVを勉強しています。コンピュータービジョンと画像処理では、人々はブロブ、輪郭、接続された領域について話します。「画像の瞬間」というフレーズを時々耳にします。 ウィキペディアの記事を知っていますが、あまりにも専門的すぎると思います。私は数学の背景に深く入りたくありませんが、私が話していることを知りたいです。 誰かが私に画像の瞬間は平易な英語であると説明してもらえますか?

2
オーディオ信号の対数フーリエ変換(LFT)
音楽をできるだけ正確に分析するようにしています。もちろんFFTを試しましたが、いくつか問題がありました。 低周波は人間の聴覚よりも解像度が非常に低いことがわかりました。この問題を解決するために非常に長い時間のFFTを試してみましたが、44100Hzのサンプルレートで8192サンプル/秒で分析しても(時間分解能の欠如を意味します)、低周波数では十分な分解能が得られませんでした。 私はいくつかの解決策があることを発見しました。 最初に、FFTビンの2次補間。 しかし、それは完璧な方法ではないようです。この方法の問題は次のとおり です。1。「freqビン間のfreqを決定する場合、補間を行うためにどの3つのビンを選択する必要がありますか?」 2.「これを行っても、結果に関する実際の追加情報はありません。補間は一種のトリッキーな方法だと知っています。」 次に、目的の頻度で各周波数ビンを抽出するので、ビンを対数的に抽出できます。 しかし、重大な計算コストの問題があります:(多分)N ^ 2。 第三に、LFT(対数フーリエ変換)。 これは対数間隔のサンプルを必要とし、信じられないほど速い速度で私が探しているものとまったく同じ結果をもたらします。/programming/1120422/is-there-an-fft-that-uses-a-logarithmic-division-of-frequency しかし、そのアルゴリズムについてはわかりません。紙を理解して実装しようとしましたが、英語と数学のスキルが不足していたため不可能でした。 したがって、LFTの実装の助けが必要です。
9 audio  fft 

1
車両に取り付けられた加速度計を使用してどのようにしてポットホールを検出できますか?
私は現在DSPとFFTを勉強しています。これに非常に慣れておらず、Arduinoと趣味のプロジェクトで長い間電子機器を扱っています。最近、私はあなたの毎日の通勤に沿って道路の粗さを測定するために、くぼみをマッピングすることを目的としたプロジェクトを行っています。これは道路の外形ではありませんが、旅行中にドライバーが感じる乗り心地の粗さです。ポットホールに衝撃が加わったときに、Z軸の「垂直」加速度を測定するために加速度がマウントされています。単純化するために、クォーターカーモデルのように、ばねが力を弱めます。 基本的には、FFTを使用して垂直加速度の支配的な周波数を見つけることにより、ポットホールを検出する検出器を作成したいのですが、パターンに一致させて、車のドアのドアのスラミングやマンホールカバーを検出できます。たぶん将来的には穴から。 FFTが適しているかどうかは不明ですが、入力やアドバイス、アイデアは大歓迎です。ドライブパスとエンジンからの高周波数の振動を除去するために、ローパスフィルターを作りました。 車の乗客/ドライバーが感じた「荒さ」に関するアイデアはありますか?私は滑らかな道路、砂利道、レンガ道、悪路で路上試験を行い、垂直加速度の大きさのしきい値を考え出し、「ラフ」と見なされるものに何らかの方法でスケールを付けることを考えていました。 検出されたポットホールもGPSの場所でログに記録されます。私はこのためにRasberry Piを使用しようとしています。データストレージとその速度は、そのための優れたプロジェクトです。 本やチュートリアル、知恵など、どんな助けやアイデアにも感謝します。 更新: ここに追加データを引き継ぎます: /electronics/56238/accelerometer-data-smoothing-filtering-pothole-detection
9 fft 

3
ノイズの多い音声信号からメッセージをフィルタリングする
非常にノイズの多いオーディオファイル(.wav)に隠されたメッセージを解読しようとしています(低ドローンが追加されたホワイトノイズだと思います)。メッセージは6桁の数字です。騒音についてこれ以上詳しく知りません。 私はローパスフィルターを使用して、高周波数のほとんどを排除すると数字が聞こえるようになることを期待しましたが、低ドローンを十分に取り除くことができず、声を十分に聞くことができません。私の試みは次のとおりでした(採用された機能freq_space_low_pass_filterは最後に含まれています): [data, SampleRate, NbitsPerSample]=wavread('noisy_msg6.wav'); y=data(:,1); % we will work only with one channel in this demo N=length(y); %number of sample points t=( (1:N)*1/SampleRate ).'; % time spacing is 1/SampleRate and we want column vector Y=fft(y); spectrum_freq=fourier_frequencies(SampleRate, N); Freq3db=100; [spectrum_filtered,g_vs_freq]=freq_space_low_pass_filter(Y, SampleRate, Freq3db); y_filtered=ifft(spectrum_filtered); y_filtered=real(y_filtered); wavwrite(y_filtered/(0.1+max(y_filtered)), SampleRate, NbitsPerSample, 'noisy_msg6_filtered.wav'); %%%%%%%%down sampling%%%%%%%% …

4
ノイズの多い正弦波のゼロクロッシング
正弦波を方形波に変換するために、正弦波のゼロクロッシングを見つけようとしています。唯一の問題は、正弦波にノイズが多いため、大量のジッターと誤ったゼロ交差が発生することです。 誰でも簡単な擬似コードや関連資料を推薦できますか?これまでのところ、私はこのようなものを持っています: if (sample[i]>0 && sample[i+1]<0) || (sample[i]<0 && sample[i+1]>0) 誰かがより堅牢な方法を推奨できますか?
9 noise 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.