タグ付けされた質問 「multi-scale-analysis」


2
ガウスの違い、ガウスのラプラス、メキシカンハットウェーブレットの違いは何ですか?
CVで使用されている3つの手法は非常に似ていますが、微妙な違いがあります。 ガウスのラプラシアン:∇2[g(x,y,t)∗f(x,y)]∇2[g(x,y,t)∗f(x,y)]\nabla^2\left[g(x,y,t)\ast f(x,y)\right] ガウスの差:[g1(x,y,t)∗f(x,y)]−[g2(x,y,t)∗f(x,y)][g1(x,y,t)∗f(x,y)]−[g2(x,y,t)∗f(x,y)] \left[g_1(x,y,t)\ast f(x,y)\right] - \left[g_2(x,y,t)\ast f(x,y)\right] リッカーウェーブレットとの畳み込み:リッカー(x、y、t )∗ f(x 、y)Ricker(x,y,t)∗f(x,y)\textrm{Ricker}(x,y,t)\ast f(x,y) 私が現在理解しているように:DoGはLoGの近似です。どちらもブロブ検出で使用され、どちらも基本的にバンドパスフィルターとして機能します。メキシカンハット/リッカーウェーブレットを使用した畳み込みでも、ほぼ同じ効果が得られるようです。 私は3つのテクニックすべてをパルス信号に適用しました(マグニチュードを類似させるために必要なスケーリングを使用)、結果はかなり近いです。実際、LoGとRickerはほとんど同じに見えます。私が気付いた唯一の本当の違いは、DoGとの違いです。LoGとRickerではなく、調整する2つの無料パラメーター(と)がありました。また、ウェーブレットが最も簡単/最速であることがわかりました。これは、DoGの場合は1回のたたみ込み(カーネルのFTを使用したフーリエ空間での乗算によって行われる)と、DoGの場合は2回、LoGの場合はコンボリューションとラプラシアンで実行できるためです。 σ 1σ1σ1\sigma_1σ1σ1\sigma_1 各手法の比較の長所/短所は何ですか? 一方が他方より優れているさまざまなユースケースはありますか? また、はカーネルとして実装できるため、LoGとRickerは別々のサンプルで同じ操作に縮退すると直観的に考えています。 。[ - 1 、2 、- 1 ]∇2∇2\nabla^2[ − 1 、2 、− 1]または⎡⎣⎢0− 10− 14− 10− 10⎤⎦⎥2D画像用[−1,2,−1]or[0−10−14−10−10]for 2D images\begin{bmatrix}-1,& 2,& -1\end{bmatrix}\quad\text{or}\quad\begin{bmatrix} 0 & -1 & 0 \\ -1 & 4 …

2
SURF機能の計算プロセスについて
それで、私はSURF(ベイ、エッス、トゥイテラー、ヴァングール:高速化された堅牢な機能(SURF))に関する論文を読んでいましたが、以下のこの段落を理解できません。 ボックスフィルターとインテグラルイメージを使用しているため、以前にフィルターしたレイヤーの出力に同じフィルターを繰り返し適用する必要はありませんが、代わりに元のイメージに直接同じ速度で任意のサイズのボックスフィルターを直接適用できます。並列でも(後者はここでは利用されませんが)。したがって、画像サイズを繰り返し縮小するのではなく、フィルターサイズを拡大することにより、スケールスペースが分析されます(図4)。 This is figure 4 in question. PS:論文にはインテグラルイメージの説明がありますが、論文の内容全体は上記の特定の段落に基づいています。誰かがこのペーパーを読んだ場合、ここで何が起こっているのか簡単に説明できますか。全体の数学的説明は、最初に十分に理解するために非常に複雑なので、いくつかの支援が必要です。ありがとう。 編集、問題のカップル: 1。 各オクターブは、一定数のスケールレベルに細分されます。インテグラルイメージの離散的な性質により、2つの後続のスケール間の最小スケール差は、派生方向(xまたはy)での部分2次導関数の正または負のローブの長さloに依存します。フィルターサイズの長さの3分の1。9x9フィルターの場合、この長さloは3です。2つの連続するレベルでは、サイズを不均一に保ち、中央のピクセルの存在を確保するために、このサイズを最低2ピクセル(各辺に1ピクセル)増やす必要があります。 。これにより、マスクサイズが6ピクセル増加します(図5を参照)。 Figure 5 私は与えられた文脈での線を理解できませんでした。 2つの連続するレベルでは、サイズを不均一に保ち、中央のピクセルの存在を保証するために、このサイズを最低2ピクセル(各辺に1ピクセル)増やす必要があります。 私は彼らが画像の長さで何かをしようとしていることを知っています、たとえそれらが奇数にしようとしているのなら、彼らがピクセル勾配の最大または最小を計算できるようにする中央のピクセルがあります。私はその文脈上の意味について少し不確かです。 2。 記述子を計算するために、Haarウェーブレットが使用されます。 ∑ d バツΣ dバツ\sum\ dx∑ | d x |Σ |dバツ|\sum\ |dx| 3。 近似フィルターを使用する必要性は何ですか? 4. フィルターのサイズの確認方法に問題はありません。彼らは経験的に何かを「した」。しかし、私はこの行のいくつかのしつこい問題を抱えています 前のセクションで紹介した9x9フィルターの出力は、最初のスケールレイヤーと見なされます。これをスケールs = 1.2と呼びます(σ= 1.2でガウス微分を近似します)。 彼らはどのようにしてσの値を知りましたか。さらに、下の画像に示されているスケーリングの計算はどのように行われますか?この画像について述べているのは、その値s=1.2についてはその起源について明確に述べずに、繰り返しの値が続くためです。 5.で 表現されるヘッセ行列Lは、ガウスフィルターと画像の2次勾配のたたみ込みです。 ただし、「近似」行列式には、2次ガウスフィルターを含む項のみが含まれていると言われています。 の値wは次のとおりです。 なぜ行列式が上記のように計算されるのか、おおよそのヘッセ行列とヘッセ行列の間の関係は何ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.