RANSACが統計で最も広く使用されていないのはなぜですか?


26

コンピュータービジョンの分野から来て、私はRANSAC(ランダムサンプルコンセンサス)メソッドを使用して、多くの外れ値を持つデータにモデルを適合させてきました。

ただし、統計学者によって使用されるのを見たことはなく、「統計的に健全な」方法とは見なされていないとの印象を受けていました。どうしてこんなことに?本質的にランダムであるため、分析が難しくなりますが、ブートストラップ方法も同様です。

または、単に学術的なサイロが互いに話し合っていない場合ですか?


1
コンピュータービジョン手法と統計手法の違いは1つあります。最初のパフォーマンスは必須です。パフォーマンスと「正確さ」の間にはトレードオフがあり、コンピュータービジョンと統計ではこれらの変数の重みが異なる場合があります。
ルーカスレイ

回答:


10

ここで重要なのは、RANSACのデータの大部分を破棄することだと思います。

ほとんどの統計アプリケーションでは、分布によっては裾が重い場合があり、したがって、サンプル数が少ないと統計的推定が歪む可能性があります。堅牢な推定器は、データの重み付けを変えることでこれを解決します。一方、RANSACは外れ値に対応する試みを行いません。これは、非正規分布だけでなく、データポイントが真に属さない場合のために構築されています。


1
素晴らしい答え。ホモグラフィを推定するためにCVで最もよく使用されるRANSACを見てきました。これは、対応する測定値のいくつかが非常に信頼できないことがわかっている場合に最も広く使用されます。また、リアルタイムのパフォーマンスやその他の考慮事項により、この手法は簡単に並列化できるため非常に人気があります。
ルカ

7

私たちにとって、それはロバスト回帰の一例にすぎません-統計学者にも使用されていると思いますが、いくつかのより良い既知の代替手段があるため、それほど広くはないかもしれません。


1
代替案の例を挙げていただけますか?私はそれを調べたいです。
ボッシケナ

5
最もよく知られている最も簡単なものは、スマート電卓(Sigh!)でよく知られているMedian-Median回帰です。Wikipedia en.wikipedia.org/wiki/Robust_regressionも参照してください 。CRAN

偏りのない回帰だけでなく、モデルが推定されたデータポイントを提供するRANSACの代替手段はありますか?ありがとう
Valerio 14

2

これは、頻繁に使用される手法であるバギングによく似ています。


3
RANSACは非常に異なります-バギングでは、すべてのサンプルが何らかの方法で考慮されます。RANSACは、データの最大50%を完全に破棄する必要がある場合に使用されます。
nbubis 14

1

データを正当化せずにRANSACで破棄しますが、モデルの適合度を高めることに基づいています。適合性を高めるためにデータを破棄することは、重要なデータを失う可能性があるため、通常は避けられます。正当化せずに外れ値を削除することは常に問題です。

もちろん、それを正当化することは可能です。たとえば、データが特定のパターンに従う必要があることがわかっているが、測定値の誤差のためにデータがパターンから逸脱している場合。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.