ふるいは画像から特徴を抽出する良い方法ですか?


13

画像から特徴を抽出しようとしていますが、抽出したいポイントを取得できなかったため、画像がテンプレートと一致しません。

良い結果を得るために、SIFTを画像に適用する前に確認する必要があるチェックポイントはありますか?たとえば、テンプレート画像は次のとおりです。
ここに画像の説明を入力してください

ターゲット画像; ここに画像の説明を入力してください


1
画像の種類と、機能の使用目的によって異なります。詳細をご覧ください。

回答:


14

シフトを使用してテンプレートを画像に一致させるときに行うべきことは、テンプレートに対してシフトを実行し、シーン内のその配置でそれらのシフト機能を探すことです。

経験則:好きなものと比較してください。

Sift(テンプレート)内に含まれるSift(イメージ)

Siftを調整して「必要な機能」を抽出することはできません。Siftは不変のメジャーを使用して、最も顕著なと思われる機能を見つけます。(*クリスA)

テンプレートから特定の機能を検索する場合は、それらの機能の小さなテンプレートを作成して検索します。

ただの提案。どのタイプのテンプレートをどのタイプのシーンまたは画像に適合させようとしているのか正確にはわかりません。


7
+1、同意します。一つのことを除いて。SIFTは、最も不変の特徴を見つけません。不変測度を使用して、最も顕著なと思われる特徴を見つけます。

7

2つの画像を一致させるだけか(共通点を見つけるか)、CBIR(コンテンツベースの画像検索-テンプレート画像でデータベースを検索して、オブジェクト)。

現在、CBIRの研究を行っているので、現在の方法はかなり最新です。ここここは、stackoverflowのあなたと同様の問題への私の答えへのリンクです、あなたは見てみる必要があります。

次に、SIFTについて少しお話しします。ifがLoweによって初めて導入されたとき、SIFTという用語は、特徴検出のプロセスと、検出された関心点で計算された特徴記述子の両方に適用されました。今日まで、SIFT 記述子は信じられないほど素晴らしいことが証明されています。記述子には、@ Toteroがすでに言及したクールなプロパティがいくつかあります。

一方、現在ではますますDoG(Difference of Gaussians)と呼ばれるSIFT 検出方法は、最先端ではなくなりました。まだ広く使用されていますが、機能検出のプロセスのために、今日より多くの方法があり、そのいくつかはDoGプロセスが抽出する不変キーポイントのタイプをより良くまたはうまく補完します。

最新の論文(リンクされたStackoverflowの質問のリンクを参照)には、もう1つの優れたプラクティスがあります:機能を検出する複数の方法を組み合わせてから、SIFT記述子(依然として記述子として揺れる)を使用して不変ベクトル表現を計算します。私は現在、DoG(画像の角のような部分に焦点を当てています)とMSER領域(複数のスケールでBlobのような区別された点に焦点を当てています)の組み合わせで作業しています。特定の画像データベースでこの組み合わせが不十分であることがわかった場合は、さらに多くのタイプの特徴検出器を試してみてください。

あなたが興味を持っている場合も、ここでは異なる検出および記述子の組み合わせのpreformancesを評価紙があります。DoG&MSER + SIFTがうまく機能するので、私はそれを読んでいませんが、私はそれをざっと読んで、論文はかなり良いです。

PS:リンク先のIEEEXploreデータベースにアクセスできない場合は、Google奨学生を使用してください。


ほんの少しの明確化:犬はガウス(2つのガウスフィルタ応答の差)の違いを表して
リボル

2

以前の応答に基づいて:

(1)組み込みの検出器の代わりに、密サンプリングでSIFT(またはこのローカルパッチ記述子の別の改良版)を使用できます。パフォーマンスと計算コストの要件に合わせて、ローカルパッチのサイズとサンプリング密度を選択できます。

(2)SIFTは、幅広いベースラインステレオマッチングのためのアフィン不変記述子です。これは、イメージを取得してアフィン変換を行うとSIFTが適切に機能することを意味します。この場合、「テンプレート」は、変換を行ってもターゲットイメージに存在する必要があります。

提案:(a)テンプレート画像のデータベースを作成し(可能な場合)、画像を検出する可能性を高めます。

(b)タスクにCBIRアプローチを採用することを選択した場合、BoWモデルをベースラインとして使用できます。

(c)テンプレート画像を関連部分のみに切り取り、高密度のSIFTを使用します。 http://www.vlfeat.org/overview/dsift.html

(4)後でPHOG(Pyramidal Histogram of Gradients)などのマルチスケール記述子を試して、結果を改善できる可能性があります。 http://www.vlfeat.org/overview/dsift.html#tut.dsift.phow

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.