観測レベルのマハラノビス距離の分布


23

私は多変量正規IIDサンプルがある場合はX1,,XnNp(μ,Σ)、そして定義(サンプルポイントから重み付けに行列を使用したベクトルへのマハラノビス距離[平方]のようなもの)、の分布(サンプルへのマハラノビス距離サンプル共分散行列を使用した平均)?AとD 2 Iˉ XS ˉ X S

di2(b,A)=(Xib)A1(Xib)
aA di2(X¯,S)X¯S

私はそれがであると主張する論文を見ていますが、これは明らかに間違っています:の(未知の)平均ベクトルを使用して分布が得られたでしょうおよび共分散行列。サンプルアナログをプラグインすると、Hotelling分布、スケーリングされた分布、またはそのようなものを取得する必要がありますが、できません。Muirhead(2005)でもAnderson(2003)でも、Mardia、Kent and Bibby(1979、2003 でも正確な結果を見つけることができませんでした χ 2 P D 2 Iμ Σ T 2 F χ 2 Pχp2χp2di2(μ,Σ)T 2F()χp2。どうやら、多変量正規分布は完全であり、多変量データを収集するたびに簡単に取得できるため、これらの人は異常値の診断を気にしませんでした:-/。

物事はそれよりも複雑かもしれません。Hotelling分布の結果は、ベクトル部分と行列部分の間の独立性の仮定に基づいています。このような独立性はとには当てはまりますが、とは当てはまりません。T 2X¯SXiS


定義では、をランダム変数とみなしていますか、それとも固定ベクトルとして扱っていますか?下付き文字を含めることは後者を示唆しますが、それは少し奇妙に思えます。di2Xi
whuber

1
ちょっとした注意事項ですが、はに関して補助的であり、は固定定数(あるべき、または同様、私はほとんど確かに)と思います。XiX¯μidi2(X¯,S)np
枢機

1
@whuber-おそらく、新しい観測値ではなく、サンプルからの観測値を使用して計算されていることを強調しますか?
-jbowman

1
@ whuber、jbowmanが言ったことにほぼ沿って-これが観測レベルの統計であることを示します(サンプル平均などのサンプルレベルの統計とは対照的)。
StasK

1
分布、ベータであり、N /N - 1 2 D 2 Iˉ XS B P / 2 N - P - 1 / 2 、しかし、私はまだd 2 iμ S )の分布を探していますdi2(X¯,S)n/(n1)2di2(X¯,S)B(p/2,(np1)/2)di2(μ,S)の分布は独立ではありません。di2

回答:


18

マハラノビス距離を活用したガウス混合モデリングを 確認してください(代替リンク)。13ページの2列目を参照してください。著者はまた、分布を導き出すためのいくつかの証拠も与えました。ディストリビューションはベータ版にスケーリングされています。これで問題が解決しない場合はお知らせください。そうでなければ、明日、SS Wilksの本でヒントを確認できます。


4
論文で与えられた答えは:。ありがとう!n(n1)2di2(X¯,S)B(p2,np12)
StasK

9

3つの関連するディストリビューションがあります。前述のように、真の母集団パラメーターが使用される場合、分布はカイ2乗です。これは、推定パラメーターと大きなサンプルサイズを使用した漸近分布でもあります。df=p

別の答えは、観測自体が推定セットの一部である場合の推定パラメーターを使用して、最も一般的な状況の正しい分布を示します ただし、観測xiがパラメーター推定値から独立している場合、分布はフィッシャーのF比分布に比例します。 nd2np

n(d2)(n1)2Beta(p2,(np1)2).
xi
(nd2(np)(p(n1)(n+1))F(p,np)

サイト@JoeSullivanへようこそ。私はLを使用する自由を取りましたを使用すると、方程式が読みやすくなります。彼らがあなたが望むものをまだ言っていることを確認してください。LATEX
GUNG -復活モニカ

Fフォーミュラのリファレンスを提供できますか?
eyaler

1
関連するリファレンスの1つであるHardin、Johanna、David M. Rockeのセクション3。2005.「ロバストな距離の分布。」Journal of Computational and Graphical Statistics 14(4):928–46。doi:10.1198 / 106186005X77685。
ジョセフ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.