距離相関の直感的な特性評価はありますか?


14

私はそれがどのように計算できるかによって特徴付けられると思われる距離相関についてウィキペディアのページを見つめてきました。計算はできましたが、距離相関の測定値と、計算が実際のように見える理由を取得するのに苦労しています。

それが測定するものを理解するのを助けることができる距離相関の(または多くの)より直感的な特性評価はありますか?

直観を求めることは少しあいまいですが、どんな直感を求めているかを知っていれば、そもそも尋ねなかっただろう。また、2つのランダム変数間の距離相関のケースに関する直感を喜んでいます(2つのランダムなベクトル間で距離相関が定義されている場合でも)。

回答:


8

これは私の答えが質問に正しく答えていません。コメントを読んでください。

通常の共分散距離共分散を比較しましょう。両方の効果的な部分は分子です。(分母は単純に平均化されます。)共分散の分子は、1つの点からの偏差の合計外積(=スカラー積)、平均です:(その重心として上付きのを使用)。このスタイルで式を書き換えるには、、は重心からの点の偏差、つまり重心までの(符号付き)距離を表します。共分散は、すべてのポイントにわたる2つの距離の積の合計によって定義されます。Σ(xiμx)(yiμy)μΣdiμxdiμydi

どのようなものがあると、距離共分散?ご存じのとおり、分子はです。上に書いたものと非常に似ていませんか?そして、違いは何ですか?ここで、距離はさまざまなデータポイント間であり、データポイントと上記の平均との間ではありません。距離共分散は、すべてのポイントペアでの2つの距離の積の合計によって定義されます。Σdijxdijyd

バツy

実際、関係が完全な線形に近くなり、分散が大きくなると、通常の共分散は大きくなります。分散を固定単位に標準化する場合、共分散は線形相関の強さにのみ依存し、ピアソン相関と呼ばれます。そして、私たちが知っているように-そして、ちょうどその理由がわかりました-関係が完全な曲線に近く、データの広がりが大きいほど、距離共分散は大きくなります。スプレッドを固定単位に標準化する場合、共分散はいくつかの曲線連関の強さにのみ依存し、ブラウン(距離)相関と呼ばれます。


2番目の段落でクリックしました。なぜウィキペディアのページに表示されなかったのかわかりません...ありがとう!
ラスマスバース14年

en.wikipedia.org/wiki/Brownian_covariance#Distance_covarianceのどこがあなたの例からの分子なのか(またはあなたの分子からウィキペディアのバージョンに到達する方法)疑問に思っていますか?...ウィキペディアはちょうど、距離共分散の二乗を計算する方法を説明し、私はトラブルが記述に対するあなたの説明に一致するのビットを抱えている
ラスマス・バース

d

はい、二重センタリングは私を困惑させてきました。それを明確にする時間があれば、大いに評価されるでしょう!:)
ラスマスバース14年

1
α=1
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.