タグ付けされた質問 「local-features」


5
スケールおよび回転不変フィーチャ記述子
フィーチャ検出で使用するために、いくつかのスケールおよび回転不変フィーチャ記述子をリストできますか。 このアプリケーションは、マルチクラス分類器を使用して、UAVによってキャプチャされたビデオ内の車と人間を検出するためのものです。 これまでのところ、SIFTとMSER(アフィン不変)を見てきました。私もLESHを見ました、LESHはローカルエネルギーモデルに基づいていますが、回転不変ではない方法で計算され、ローカルエネルギーを利用して回転不変を構築する方法を考えようとしています機能記述子、私はここを読みます商用アプリケーションで使用できるSIFT / SURFの無料の代替手段は何ですか?、「関心点に方向を割り当て、それに応じて画像パッチを回転させると、回転不変性が無料で得られます」が、これがさらに当てはまるかどうか、またはこれを私の問題にどのように適用できるかわかりません感謝します、ありがとう

2
セグメンテーションによる画像登録
通常、画像レジストレーションアルゴリズムは、SIFT(Scale-Invariant Feature Transform)などのポイントフィーチャに基づいています。 ラインフィーチャへの参照をいくつか見ましたが、ポイントの代わりに画像セグメントを一致させることが可能かどうか疑問に思っていました。たとえば、与えられたソースと変換された画像: それぞれでエッジ検出、ぼかし、および流域変換を行うことができます: 残念ながら、セグメンテーションは、個々のセグメントに一致するには各画像であまりにも異なることが判明しました。 アフィン変換に不変のマッチング形状と形状記述子に関する論文を見たので、この分野は有望であるようです... 画像のアフィン(または射影)変形に対してより堅牢なセグメンテーション方法はありますか?

1
2D点群における円(楕円)の検出
すなわちポイント(2D)のセットを考えると、点群(PC)は、質問はについてですrobust、accurateそしてcomputing-friendlyこの方法は、(高度なバージョンまたは楕円)の円を見つけること。 直感的なアイデアは、可能な限りすべてのポイント(中心として){無限!}および半径(再び無限!)でブルートフォース検索を使用することです。これは非常に遅く、非効率的です。 以下に示すように、各適合円はnn、しきい値より短い距離で円周上に配置されたポイントの数()に基づいてランク付けされます(t)。したがってderr、平均距離を提示する必要があります。 高度な形式では、楕円が適合します。 アイデア、ブレインストーミング、経験、コメントはありますか?

1
バイナリロバスト独立基本機能(「BRIEF」)の理解
Briefアルゴリズムの記述子はどのように相互に一致しますか? テンプレート画像は別の画像でどのように見つかりますか?記述子をどのように比較しますか?私はその記事を読みましたが、彼らがそれをどのように行ったか理解していませんでした。 彼らは、ハミング距離を使用して記述子を比較したと書いていますが、照明、サイズなどの変化に対する不変性はどのように達成されますか?


2
特徴検出前の画像処理
Harrisコーナーに基づいて特徴検出器を実装しました。ほとんどの場合正常に機能しますが、パフォーマンスが低下する場合があります。個別に構成せずに、さまざまな画像で機能させる必要があります。 問題は、検出器のしきい値にあります。設定が低すぎると、検出器が何度も起動し、その結果、膨大な数の機能が発生します。高すぎる設定では、機能が少なすぎます。 私はこれをANMS(Adaptive Non-Maximal Suppression)で部分的に解決し、記述子ベクトルを割り当てる前に機能の数を減らしました。 ただし、次のような画像に問題があります。 コントラストが低く、すべての画像に対してしきい値を低く設定しすぎることは「ありません」。検出器がこれらの画像を処理するようになりますが、他の画像には何千もの機能が含まれるため、ANMSでのフィルタリングが遅くなり、全体的なパフォーマンスが低下します。 特徴検出の前に画像を調整することを考えていました。たぶん、ヒストグラムの等化がうまくいくでしょう。コントラストのグローバルな変更はフィーチャ記述子に影響を与えないため、これは有効な操作である可能性があります(輝度とコントラストの変更に対して不変です)。 たぶん、適応しきい値またはいくつかのヒューリスティックを使用するほうがうまくいくでしょう。 他に何か提案はありますか?

1
画像で車のモデルを認識するための優れた機能/アルゴリズム
オブジェクトの認識、特に車種の認識について質問があります。同じ車種を異なる画像で特定する作業の始めにいます。現時点では、3Dオブジェクト認識の最良のアルゴリズムの1つはSIFTだと思いますが、デモの実装で少し遊んだ後、このアルゴリズムには車などの光沢のある金属製のオブジェクト、特に色が異なる場合に問題があるという不思議な感じがします。 誰かがこの領域でいくつかの作業を一般的にいくつかの異なるアルゴリズムで同じ車モデルを見つけるタスクに適したアルゴリズムを知っていますか? よろしくお願いします!

4
ビデオフレーム間のハリスコーナートラッキングを改善するための前処理?
無人航空機のグレースケールビデオ画像安定化アプリケーションでは、フレームNから選択されたフレームN + 1の「良い」ハリスコーナーを見つけるのが困難です。問題の原因は、フレーム間の急激な不均一なピクセルコントラストの変化にあるようです。おそらく空中にいて、遅いフレームレート(約3 fps)を使用していることが、ピクセルコントラストのシフトの根本的な原因です。 フレームN + 1の「良い」ハリスコーナーの追跡を改善するために、フレーム間のピクセルコントラストを滑らかにするために、さまざまなヒストグラム均等化手法を試しました。結果は依然として悪いままです。 誰かが遅いフレームレートの日中の空中環境でビデオフレーム間のハリスコーナートラッキングを改善する方法について何か提案がありますか?よろしくお願いします。 編集:2012年1月30日、テストケース(実際のフレームサイズではない)画像を追加 概要の更新:2012年2月8日。人々は、Harrisコーナーはグレースケールビデオ機能の追跡ではそれほど有用ではないことを示唆しています。以下の回答は、さまざまな代替案へのリンクを提案および提供しています。これらの代替案を評価しており、その時点で結果を報告します。コメントと回答をありがとうございました。 これは、35個の「良好な」5x5ハリスコーナーが選択された前のフレームNです。元のフレームは8 bppのrawピクセルです。 59列266列目にある5x5のハリスコーナーは次のとおりです。 追跡された5x5のHarrisコーナーがいくつかある現在のフレームN + 1。そのうちの1つだけが有効です。 r47 c145のフレームN + 1に表示される前のフレーム5x5 Harrisコーナー: 選択した5x5のピクセル強度がすべて、前のフレームから現在のフレームまで不均一に変化していることに注意してください。フレーム間のコントラストイコライゼーションテクニックは、現在のフレームで選択された5x5ピクセルの前のフレームを検出するのに役立ちません。すべての提案を歓迎します。

1
円形画像のOCRに推奨される前処理方法
こんにちは、これは私のサンプル画像です。このような画像でリアルタイムに文字を検出します。 前処理なしで、元の画像でSURF、SIFT、MSER、およびテンプレートマッチングを試しました。文字を検出することはできますが、画像が変化しても、画像上の文字に多くの関心のあるポイントがないため、この機能検出方法は機能しません。精度を上げるためにどのような前処理を行うべきか、正確にはわかりません。 だから私の質問は、皆さんがより高い精度で文字検出を行うためにどのような方法を提案できるかです。 前もって感謝します。

3
画像特徴の検出とマッチングの目的
私は画像処理とコンピュータービジョンの新人なので、この質問はあなたには馬鹿げているかもしれません。 Harris、Hessian、SIFT、SURFなど、いくつかの特徴検出および記述アルゴリズムを学びました。画像を処理してそれらのキーポイントを見つけ、それぞれの記述子を計算します。記述子は、特徴照合に使用されます。 私はSIFTとSURFを試してみましたが、2つの画像(1つは回転して少しアフィンされている)の場合、それらは機能によく一致せず、ほぼ100の特徴点のうち10マッチは良いです。 だから私は思う これらの特徴検出アルゴリズムを実際に何に使用できますか?特徴の検出とマッチングのためのより堅牢なアルゴリズムはありますか?または、SIFTとSURFは既に良好ですが、さらに使用するために調整する必要がありますか? もう1つの問題は、これらのアルゴリズムは(マルチコアの実装を考慮せずに)リアルタイムアプリケーションには適していないと思いましたが、リアルタイムで機能し応答する商用製品(Kinectなど)があることです。これらの製品も、見たものから機能を検出して照合すると思いますが、SIFTなどのアルゴリズムを使用していますか?どのようにして機能をうまく検出できるでしょうか? 知識が限られているため、2つの画像で同じオブジェクトを見つけたり、ホモグラフィを推定したりするために機能マッチングを使用できることはわかっていますが、機能マッチングの他の目的はありますか?

1
ヘッセ特徴検出器はどのように機能しますか?
私は、ハリスコーナー検出器について知って、私はその基本的な考え方を理解する二次モーメント行列を、 、エッジおよびその他の不安定なポイントはを介して削除できます。M=[I2xIxIyIxIyI2y]M=[Ix2IxIyIxIyIy2]M = \left[ \begin{array}{cc} I_x^2 & I_xI_y \\ I_xI_y & I_y^2 \end{array} \right]MMM ただし、ヘッセ行列検出器については、ヘッセ行列を使用してキーポイントを検出し、エッジを削除します。 H=[IxxIxyIxyIyy]H=[IxxIxyIxyIyy]\mathcal{H} = \left[ \begin{array}{cc} I_{xx} & I_{xy} \\ I_{xy} & I_{yy} \end{array} \right]、そしてHH\mathcal{H}エッジを削除して安定した点を検出する方法がわかりませんか?その背後にある直感的な基本的な考え方は何ですか?

1
DWTを使用した特徴の抽出/削減
nタイムスタンプの長さの特定の時系列に対して、(「Haar」ウェーブレットを使用して)離散ウェーブレット変換を実行し、次に取得します(たとえば、Pythonで)- >>> import pywt >>> ts = [2, 56, 3, 22, 3, 4, 56, 7, 8, 9, 44, 23, 1, 4, 6, 2] >>> (ca, cd) = pywt.dwt(ts,'haar') >>> ca array([ 41.01219331, 17.67766953, 4.94974747, 44.54772721, 12.02081528, 47.37615434, 3.53553391, 5.65685425]) >>> cd array([-38.18376618, -13.43502884, -0.70710678, 34.64823228, -0.70710678, 14.8492424 , -2.12132034, 2.82842712]) …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.