回答:
マハラノビス距離の下部から上部への説明でのマハラノビス距離の説明は?2つの主要な結果が含まれます。
定義上、リグレッサが均一にシフトされても変化しません。
ベクトル間の二乗マハラノビス距離及びで与えられる
(1)リグレッサの平均がすべてゼロであると仮定することができます。計算は残ります。ただし、主張が真実であるためには、もう1つの仮定を追加する必要があります。
モデルにはインターセプトが含まれている必要があります。
これを可能にすることが聞かせて説明変数とデータ、リグレッサの値書き込む観察するためののような。リグレッサーjのこれらの値の列ベクトルをx 、j、観測値iのこれらのk値の行ベクトルと書く書き込まれる。次に、モデル行列は
そして、定義により、帽子行列は
対角線に沿ったエントリは
その中心行列を逆にすること以外には何もありませんが、最初の重要な結果のおかげで、特にブロック行列形式で記述する場合は簡単です:
どこと
(リグレッサのサンプル共分散行列のを記述しました。)これはブロック対角であるため、その逆はブロックを反転するだけで簡単に見つけることができます。
From the definition we obtain
Solving for the squared Mahalanobis length yields
QED.
Looking back, we may trace the additive term to the presence of an intercept, which introduced the column of ones into the model matrix . The multiplicative term appeared after assuming the Mahalanobis distance would be computed using the sample covariance estimate (which divides the sums of squares and products by ) rather than the covariance matrix of the data (which divides the sum of squares and products by ).
The chief value of this analysis is to impart a geometric interpretation to the leverage, which measures how much a unit change in the response at observation will change the fitted value at that observation: high-leverage observations are at large Mahalanobis distances from the centroid of the regressors, exactly as a mechanically efficient lever operates at a large distance from its fulcrum.
R code to show that the relation indeed holds:
x <- mtcars
# Compute Mahalanobis distances
h <- hat(x, intercept = TRUE); names(h) <- rownames(mtcars)
M <- mahalanobis(x, colMeans(x), cov(x))
# Compute D^2 of the question
n <- nrow(x); D2 <- (n-1)*(h - 1/n)
# Compare.
all.equal(M, D2) # TRUE
print(signif(cbind(M, D2), 3))