たとえば、古いものと新しいものの2つの多変量データセットが与えられ、それらが同じプロセス(モデルを持たない)によって生成されたはずですが、おそらく収集/作成のラインに沿ってどこかにあるとしますデータ、何かがおかしくなりました。新しいデータを、たとえば古いデータの検証セットとして使用したり、古いデータに追加したりしたくないでしょう。
ウィルコクソンのランクサムなど、1次元の統計(変数ごと)を多数実行して、複数のテスト修正を試すことができますが、それが最適かどうかはわかりません(マルチテストの問題はもちろん、多変量データの複雑さをキャプチャするため)。1つの方法は、分類子を使用して、2つのデータセットを区別できるかどうかを確認することです(最適な最適な分類子が与えられた場合)。それはうまくいくように見えますが、それでもa)より良い方法があるperhpas b)なぜそれが違うのかをあなたに伝えるように本当に設計されていません