信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

4
OpenGLでバイナリイメージのコーナーを検出する方法は?
次のような160x120のバイナリイメージがあります。 これらの白い塊の角を検出したいと思います。それらは以前は数学的形態によって閉じられていたため、内側に角はありません。この特定のケースでは、次のような16のコーナーが必要です。 私の最初の試みは、goodFeaturesToTrackやFASTなどのOpenCV関数を使用することでしたが、それらは特に低速です(さらに、FASTは非常に不安定です)。私のアイデアは、ソースイメージがGPUから取得されるため、GPUでそのような計算を行うことです。私はそのようなシェーダーの書き方に関するアイデアをウェブで探しました(OpenGL ES 2.0を使用しています)が、具体的なものは見つかりませんでした。このようなアルゴリズムをどのように開始できるか考えていますか?

3
信号のフーリエ変換の実数部と虚数部の意味
たとえば、は時間信号、は変数フーリエ変換です。t F vffftttFFFvvv 極座標では、は、信号に周波数がどれだけ存在するかを示し、は、この周波数の寄与が位相シフトされる量を示します。v A r g (F (v ))| F(v )||F(v)||F(v)|vvvA r g(F(v ))Arg(F(v))Arg(F(v)) その実部と虚部はどのような情報を教えてくれますか? または、質問を再定式化する場合、極座標でできるようにデカルト座標でフーリエ変換の解釈を与えることができますか?

2
周波数領域での相互相関の直感的な説明
相互相関定理によれば、2つの信号間の相互相関は、1つの信号のフーリエ変換と別の信号のフーリエ変換の複素共役の積に等しくなります。これを行った後、積信号のifftを取得すると、2つの信号間のシフトを示すピークが得られます。 これがどのように機能するのか理解できませんか?2つの信号間のシフトを示すピークが得られるのはなぜですか。http://mathworld.wolfram.com/Cross-CorrelationTheorem.htmlから数学を取得しましたが、 これが直感的に何を意味するのか理解できません。誰かが説明を提供したり、適切な文書を教えてくれたりできますか? ありがとう!

2
エントロピーとSNRの関係
一般に、あらゆる形のエンロピーは不確実性またはランダム性として定義されます。ノイズが増加するノイズの多い環境では、目的の信号の情報内容が不確実であるため、エントロピーが増加すると考えています。エントロピーとSNRの関係は何ですか?信号対雑音比が増加すると、雑音電力は減少しますが、これは信号の情報量が増加することを意味しません!! 情報内容は同じままかもしれませんが、それはエントロピーが影響を受けないということですか?

3
ハイゼンベルクの不確実性原理を平等として書くことができるのはいつですか?
私たちは、ハイゼンベルグの不確定性原理は、と述べていることを知っている ΔfΔt≥14π.ΔfΔt≥14π.\Delta f \Delta t \geq \frac{1}{4 \pi}. しかし、(多くの場合、Morletウェーブレットの場合)不平等が平等に変わったことがわかりました。我々は平等に不平等を変更することが許可されていたときに今、私の質問は: ΔfΔt=14πΔfΔt=14π\Delta f \Delta t = \frac{1}{4 \pi} why =

3
圧縮センシングにおける信号のスパース性の代替の特性化はありますか
圧縮センシング(CS)の最初の前提は、基礎となる信号が何らかのベースでスパースであるということです。たとえば、sには非ゼロのフーリエ係数が最大です sss -sparse信号。また、実際の経験では、考慮中の信号がしばしばスパースであることを示しています。 問題は、信号が与えられ、圧縮サンプリングされたビットを受信機に送信し、彼女の能力を最大限に回復させる前に、そのスパース性が何であるか、圧縮の適切な候補であるかどうかを伝える方法があるかどうかですそもそも感知? あるいは、CSが有用かどうかをすぐに判断できる、スパース性の追加/代替の特性があります。送信者がランダムに選択した一連の測定値を使用して受信者が行うことを正確に実行できることを簡単に確認してから、答えを見つけようとします。しかし、この質問を解決する別の方法はありますか? 私の疑いは、このようなものが研究されたに違いないということですが、良い指針を見つけることができませんでした。 注:この質問は、数週間前にMathoverflowに投稿しましたが、回答がありませんでした。したがって、クロスポスト。

2
テンプレートマッチングの前に必要な画像処理操作
まあ、これは私が画像処理クラスを取っていないことを示しているかもしれません。 画像内のオブジェクトに一致するこのテンプレートがあります。しかし、たとえば画像内の実際のオブジェクトは、2番目の画像ではなく、そのように見えます。2番目のような画像をテンプレートマッチングの準備ができるようにするには、どのような操作が必要ですか?参考までに、3番目の画像は理想的なマッチングを示しています。 別のアイデアでは、テンプレートを画像に合わせます。つまり、テンプレートの座標と一致するように、画像の4つのコーナー座標を指定します。次に、テンプレートを領域に合わせる方法を計算します。 更新:問題は解決しました。以下で選択した回答に感謝します。画像にテンプレートを適用することに成功しました。最後の画像は結果を示しています。

5
離散時間フーリエ変換
私は中学生であり、エレクトロニクス、プログラミングなどの全般的な魅力を持っています。最近、私は信号処理について学んでいます。 残念ながら、私はまだ多くの計算を行っていません(私を許して)ので、私は物事に少しあいまいです。 信号のDTFTを計算する場合、その信号のまたは表現の違いは何ですか?sinsin\sincoscos\cos DTFTを使用すると、入力した信号が時間的に離散することがわかりますが、世界でどのように周波数領域で連続的な信号を実現できますか? これは私の2番目の質問につながります。DTFTはどのように役立つのでしょうか?ほとんどのアプリケーションでどこで使用されていますか? 助けていただければ幸いです。

2
ギブス現象の数学的な説明
矩形波、のこぎり波など、どこでも微分可能でない信号を構築する文脈でフーリエ級数がどのように機能するかを誰かに説明していました。実際、話が進むにつれて、誰もがそれが周期的な信号の無限のシリーズの実際の数学的特性であり、計算のまぐれではないことに気づいたわけではなく、ほとんどの証拠はかなり面倒で精巧であることがわかります。 それらのいくつかを読んだ後、そのような現象が発生する理由を理解し始めましたが、実際の複雑な分析やトポロジーなどの背景があります。問題は、アーセナルに基本的な学部の微積分コース(または学部の信号処理コースのその他の一般的な前提条件)だけを持っている人に、ギブズ現象を数学的に完全に説明し、厳密に証明できるかどうかです。もしそうなら、どのように?

2
システム識別パッケージ
私はMatlabのSystem Identification Toolboxに代わるものを探し回っていましたが、「システム」と「識別」という用語の共通性が検索を混乱させています。 この目的のために書かれたスタンドアロンライブラリはありますか?(C ++、C#、Pythonなど)

2
DFTではなくDCTを音声振幅スペクトルに使用できますか?
私の理解では、DCTのビンサイズは同じサイズNのDFTの半分です。DFTには位相情報も含まれますが、振幅スペクトルのみが必要な場合、これはしばしば不要です。 DCTを使用して、DFTの2倍の密度(ビン間隔の半分)の振幅スペクトルを提供できますか、または位相がずれた情報が失われますか? 50%のオーバーラップでどうですか?
13 dct  dft 

3
離散フーリエ変換:DC項は本当に何ですか?
私は現在、Matlabの離散フーリエ変換(DFT)をいじって、画像から特徴を抽出しています。私が使用している概念を完全に理解したい。私はこれなどいくつかの説明を読みましたが、これまでのところ、「DC用語」の意味を実際に説明したものはありません。私が知っているのは、DFTの k '項が次のように記述できることです。 どこ で回転因子は。 つまり、最初の項(DC項)は、周波数のない振幅です。 なぜそれがDC用語と呼ばれているのか誰かが説明できますか?「直流」との関係は?そして、DC用語の関連性は何ですか?それはいつ、何のために役立ちますか?
13 image  matlab  fft  dft 

6
信号処理と制御システム工学の関係は?
制御システム工学とデジタル信号処理はどちらも電気工学の重要なコース/科目ですが、これら2つの科目/コースは互いにどのように関連していますか? また、制御システムエンジニアリングに関する推奨リソース(本、チュートリアル、講義など)と、技術レベルでの作業を開始する方法について教えてください。 以下のリンクで回答がありますが、その回答はdspリソースに関するものなので、制御システムエンジニアリングに関する参考資料を探しています。

3
単純な写真には、複雑な絵よりも多くの情報が含まれていますか?
この質問がこのサイトに適していることを願っています。 Liu Cixinの小説であるThe Three Body Problemのこの箇所に出会いました。 教授は2枚の写真を掲示しました。1つは、清明祭の期間中に川沿いの有名なSong王朝の絵でした。もう1つは晴れた日の空の写真、雲の切れ間だけで壊れた深い青色の広がりでした...写真の情報量-そのエントロピー-は絵画の1桁または2桁を超えていました 代表的な写真: これは本当ですか?この直感に反する現象をどのように説明しますか?

1
どの変換が人間の聴覚システムに最もよく似ていますか?
フーリエ変換は、一般的に音の周波数分析のために使用されています。ただし、音の人間の知覚を分析することになると、いくつかの欠点があります。たとえば、周波数ビンは線形ですが、人間の耳は周波数に線形ではなく対数的に応答します。 ウェーブレット変換は、フーリエ変換とは異なり、異なる周波数範囲の解像度を変更できます。プロパティは、ウェーブレット変換より高い周波数のための短い時間的幅を維持しながら、より低い周波数のための大規模な一時的なサポートを可能にします。 ウェーブレットモレット密接に聴力の人間の知覚に関連しています。音楽の転写に適用でき、フーリエ変換技術では不可能な非常に正確な結果を生成します。各音の開始時間と終了時間を明確にしながら、繰り返して交互に繰り返される音符の短いバーストをキャプチャできます。 定Q変換(密接ウェーブレットモレットに関連する)もされてよく演奏データに適しました。変換の出力は対数周波数に対して効果的に振幅/位相であるため、特定の範囲を効果的にカバーするために必要なスペクトルビンが少なくなります。これは、周波数が数オクターブにわたる場合に役立ちます。 この変換では、周波数ビンが高くなると周波数分解能が低下します。これは、聴覚アプリケーションに適しています。これは人間の聴覚システムを反映しており、低周波数ではスペクトル解像度が向上し、高周波数では時間解像度が向上します。 私の質問はこれです:人間の聴覚システムを密接に模倣する他の変換はありますか?解剖学的/神経学的に人間の聴覚系に可能な限り厳密に一致する変換を設計しようとした人はいますか? たとえば、人間の耳は音の強さに対して対数応答することが知られています。等ラウドネスの等高線は、強度だけでなく、スペクトル成分の周波数の間隔によっても変化することが知られています。多くの重要な帯域のスペクトル成分を含む音は、総音圧が一定のままであっても、より大きな音として知覚されます。 最後に、人間の耳には、周波数に依存する時間分解能が制限されています。おそらくこれも考慮に入れることができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.