共変量シフト検出


回答:


3

非ランダム性と共分散シフトを検出するためのカルバックライブラーダイバージェンスモデルヴァルトウォルフォウィッツ検定などの方法があります。

共分散テストをすばやく分析するための簡単なテストは、機械学習モデルを構築することです。このモデルでは、トレーニングデータと本番データを入力してモデルを繰り返しテストします。

場合によっては、モデルはトレーニングデータセットと本番データセットの違いを明らかにできるため、共分散シフトの兆候である可能性があります。



1

使用できる簡単な手順は次のとおりです。

  1. トレーニング/テストデータを区別するための分類子を学ぶ(通常のX機能を使用)
  2. ファイ相関係数を計算して、分類器の品質を評価する=トレイン/テストデータの分離可能性
  3. しきい値(たとえば.2)を設定します。このしきい値を超えると、共変量シフトがあると主張できます(そして、修正と見なし始めます)。

0

検討している可能性のあるイメージのプロパティについての手がかりはあまりありませんが、測定したいのはトレーニングセットとテストセットの分布の違いだと思われます。開始するのに役立つ場所は、2つの分布の差の尺度であるカルバックライブラーダイバージェンスです。


0

共変量シフトの問題は、最終的には異なる基礎となる数学的構造を持つデータセットになります。これで、マニホールドラーニングは高次元データの低次元表現を推定し、それによって基礎となる構造を明らかにします。多くの場合、多様体学習手法は予測ではありません-したがって、標準のPCAとは異なり、より強力です。

マニホールド学習手法(例:IsoMap、MDSなど)を使用して、トレーニングデータセットとテストデータセットの「(非)類似性」を視覚化(および可能であれば、定量化)しました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.