コンピュータービジョンアルゴリズムの精度


8

タスクが画像上の要素の位置を決定することであるとしましょう。最初に非常に重要なことは、オブジェクトを正しく検出することです。次に、位置を計算するいくつかのアルゴリズムが使用されます(問題のあるブロブ分析のため)。すべては複数のものに依存します(検出の正確さ、使用されるアルゴリズムなど)

カリブレーションされた画像があり、カリブレーションによって与えられたエラーを知っているとしましょう。コンピュータ(およびマシン)ビジョンアルゴリズムの精度を確実に計算する方法は何ですか?それは分析的に、または実験とテストによってのみ行うことができますか?

質問は、要素の位置やその他のコンピュータービジョンの問題を検出した場合のケースを追加します。

コンピューター/マシンビジョン、特に要素の位置検出に関連する問題への参照を取得し、この正確さを示すための分析的または実験的アプローチのいくつかの正確さの計算を提示します。

この質問を改善する方法の提案も歓迎します。

回答:


4

たとえば、Hartley&Zissermanは、ホモグラフィ推定の前に事前調整を使用することを推奨しています。これは、直接行列の逆行列を取ると、大きなエラーや不安定性が生じる可能性があるためです。これは、逆行列を使用するすべての数値メソッドに適用されます。

特徴検出アルゴリズムは、関心点の位置のサブピクセル近似をよく使用します。

数値的方法を論じているほとんどの本も、それらの安定性分析を扱っています。

推定量(最小二乗推定量でも最尤推定量でも)の精度と正確さを分析するために、いくつかの統計を行う必要がある場合があります。これは、外れ値を処理するRANSACなどのアルゴリズムで役立ちます。また、推定された変換がデータにどの程度適合しているかを知り、不正確な結果を破棄することもできます。

有限差分を使用したり、フィルタリングを行ったりすると、わずかなガウスぼかしがノイズを除去するために実行されます。そうしないと、2次導関数に大きなエラーが発生します。

コンピュータビジョンのいくつかの問題は不適切です。それらを解決するには、正則化の方法(ティコノフ正則化など)が必要です。これが必要な例には、異方性拡散の計算が含まれます。


したがって、これは、いくつかの特徴を検出し、統計を使用してそれらをモデル特徴に一致させる場合に適用されます(この一致により、計算可能なエラーが発生します)。特徴検出エラーの計算はどうでしょうか。たとえば、特徴がしきい値処理によって抽出されたblobである場合はどうなりますか?
krzych 2012

画像だけでは「検出誤差」は計算できないと思います。機能が誤っていると言える状況が必要です。
Libor 2012

正確にしかし何の文脈。機能検出の正確さを理解するためにいくつかのテストを設計する方法は?
krzych 2012

2
H&Zが彼らの本で述べたように:「これは鶏と卵の問題です...」最初にそれらを照合しないと、どの機能が「良い」か「悪い」かはわかりません。大規模なデータセットと十分に一致するように、機能記述子の設計にはいくつかの進展があります。記述子の「品質」を測定すると、一致する可能性が低い機能を区別できます。
Libor 2012

しかし、システム全体の正当性を評価する方法がいくつかあるに違いありません。特に要素の配置について話す場合、マシンビジョンアプリケーションにとって非常に重要だと思います。質問で述べたように、この正しさをテストするいくつかの方法にも興味があります。
krzych 2012

4

これは質問全体に答えるものではありませんが、OPが要求することの一部に対処します。

実験的にしかできません。これを分析的に行うには、アルゴリズムが返す必要があるものに関する情報が必要になります。しかし、それを知るには、比較する既知の常に正しいコンピュータービジョンアルゴリズム(およびテスト対象の画像の詳細な分析的説明)が必要です。分析ソリューションは、ケースバイケースで手作業で生成されるのではなく分析的なグラウンドトゥルースの知識を必要とします。しかし、グラウンドトゥルースを生成する分析的な方法はありません。これが、開発しようとしているものです。

実験的にしか実行できないことを考えると、Google Scholarを確認することをお勧めします。人の位置を特定する必要がある場合は、人の位置を特定するための専用の紙や、頭や手のような人の部分がたくさんあります。車の位置にも多くの専門的な注意が払われます。他のオブジェクトは一般的なアルゴリズムを必要とします。


いくつかの参考文献はこの答えを改善する可能性があります。
krzych
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.