変数内の分散とペアワイズ距離の間のリンク


20

、我々は2つの変数を(同じサンプルサイズ)があればということを証明してくださいとと分散でよりも大きい、その後、差の2乗和内のデータポイント間の(ユークリッド距離の二乗すなわち)もより大きく、内のそれ。Y X YXYXYYXY


1
明確にしてください:分散と言うとき、サンプル分散を意味しますか?差の平方和と言うとき、あなたはを意味しますか?i,j(xixj)2
枢機

9
前述の仮定:クロスタームの要素を慎重に考慮します。(小さなギャップ)を埋めることができると思います。結果は簡単になります。
i,j(xixj)2=ij((xix¯)(xjx¯))2=2ni=1n(xix¯)2
枢機

2
とがからiid (明確に定義された分散を持つ)である場合、あるという事実を考慮することにより、計算を「せずに」行う方法もあります。ただし、確率の概念を少ししっかりと把握する必要があります。バツ1バツ2FEバツ1バツ22=2Varバツ1
枢機

1
関連する質問については、stats.stackexchange.com / a / 18200の返信で、ここで何が起こっているかを視覚化して使用しました。2乗の差は2乗の面積です。
whuber

1
@whuber:とてもいい。どういうわけか私は途中であなたのこの答えを見逃していた。
枢機

回答:


5

「公式の」回答を提供するため、コメントにスケッチされたソリューションを補足するために、通知

  1. いずれ、、、又は全てシフトさせることによって変更されたに均一いくつかの定数をまたはすべてのシフトY のIY I - νを何らかの定数のためν。したがって、にようにそのようなシフトが実行されたと仮定することができます。ここでおよびVAR Y IΣ I JX I - X J 2 Σ I JY I - Y J 2 X I X 、I - μ μ Σ X I = Σ Y i = 0 Var X iヴァーバツヴァーYjバツバツj2i,j(YiYj)2XiXiμμYiYiννバツ=Y=0 Var Y i= Y 2 iヴァーバツ=バツ2Var((Yi))=Yi2

  2. 各側から共通の要因をクリアして(1)を使用した後、質問はが意味することを示すように求めます Σ I JX I - X J 2Σ I JY I - YのJ 2Xi2Yi2i,j(XiXj)2i,j(YiYj)2

  3. 正方形の単純な展開と合計の再配置により、と同様の結果

    i,j(XiXj)2=2Xi22(Xi)(Xj)=2Xi2=2Var((Xi))
    Yます。

証明は即時です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.