直観(幾何学的またはその他)


18

分散の基本的なアイデンティティを考えてみましょう:

Var(X)=E[(XE[X])2]=...=E[X2](E[X])2

これは、中心モーメントを非中心モーメントに定義する単純な代数的操作です。

他のコンテキストでを簡単に操作できます。また、最初に平均を計算し、次に分散を計算するために、2回のパスではなく、データの1回のパスで分散を計算できます。Var(X)

しかし、それはどういう意味ですか?平均についての広がりを0についての広がりに関連付ける直接的な幾何学的直観はありませんは1次元の集合であるため、平均の周りの広がりを、原点の広がりと正方形の平方との差としてどのように見ますか平均?X

このアイデンティティへの洞察を与える良い線形代数解釈または物理的解釈または他のものはありますか?


7
ヒント:これはピタゴラスの定理です。
whuber

1
@Matthew「」は何を意味するのでしょうか。これは予想ではなく、算術平均の略記だと思います。そうしないと、方程式は不正確になります(そして、ランダム変数を数値と同一視するため、ほとんど意味がなくなります)。E
whuber

2
@whuber内積は距離と角度の概念を導入し、実数値のランダム変数のベクトル空間の内積は(?)として定義されるため、いくつかの幾何学的な直観は三角形の不等式。どうすればいいのかわかりませんが、意味があるのか​​どうか疑問に思っていました。E[XY]
アントニ・パレラダ

1
@Antoni三角形の不等式は一般的すぎます。内積は、はるかに特別なオブジェクトです。幸いなことに、適切な幾何学的直観は、正確にはユークリッド幾何学の直観です。さらに、ランダム変数およびの場合でも、必要なジオメトリは、およびによって生成される2次元の実ベクトル空間、つまりユークリッド平面自体に制限できます。現在の例では、はRVではないように見えます。これは、ベクトルだけです。ここで、とまたがる空間は、すべてのジオメトリが発生するユークリッド平面です。XYXYXnX(1,1,,1)
whuber

3
設定β 1 = 0私はにリンクされている応答で、かつ、すべての条件を分割するn個(ご希望の場合は)あなたに分散のための完全な代数的なソリューションを提供します:すべての繰り返しそれをコピーする理由はありません。それのためにβ 0の算術平均であるyが、そこ| | Y - Y | | 2はここで定義した分散のちょうどn倍です| Y | | 2は算術平均のn倍であり、|β^1=0nβ^0y||yy^||2n||y^||2n||y||2は、2乗値の算術平均のn倍です。
whuber

回答:


21

コメントの@whuberのポイントを展開すると、YZが直交している場合、ピタゴラスの定理があります:

Y2+Z2=Y+Z2

ことを観察Y,ZE[YZ]有効である内積そのY=E[Y2]は、その内積によって誘導されるノルムです

ましょXいくつかのランダムな変数です。LET Y=E[X]、LET Z=XE[X]YZが直交する場合:

Y2+Z2=Y+Z2E[E[X]2]+E[(XE[X])2]=E[X2]E[X]2+Var[X]=E[X2]

そして、Z = X E [ X ]がこの内積の下で直交していることを示すのは簡単です:Y=E[X]Z=XE[X]

Y,Z=E[E[X](XE[X])]=E[X]2E[X]2=0

三角形の脚の1つは、他の脚はE [ X ]、斜辺はXです。そして、卑劣な確率変数はその平均に直交するため、ピタゴラスの定理を適用できます。XE[X]E[X]X


技術的な発言:

この例では、実際のベクトルである必要があり Y = E [ X ] 1、スカラーで、 E [ X ]回定数ベクトル 1(例えば 1 = [ 1 1 1 ... 1 ] "離散で、有限結果の場合)。Yは、 Xの定数ベクトル 1へのベクトル投影です。YY=E[X]1E[X]11=[1,1,1,,1]YX1

簡単な例

ベルヌーイ確率変数で、p = .2である場合を考えます。我々は持っています:Xp=.2

X=[10]P=[.2.8]E[X]=iPiXi=.2

Y=E[X]1=[.2.2]Z=XE[X]=[.8.2]

そして写真は次のとおりです。 ここに画像の説明を入力してください

赤ベクトルの2乗の大きさはの分散であり、青ベクトルの2乗の大きさはE [ X ] 2であり、黄色ベクトルの2乗の大きさはE [ X 2 ]です。XE[X]2E[X2]

覚えこれらの大きさ、直交性などそのかかわら...通常の内積に対してないが、内積Σ I P 、I 、Y I Z iが。黄色のベクトルの大きさは1ではなく、0.2です。iYiZiiPiYiZi

赤ベクトルおよび青ベクトルZ = X - E [ X ]は、内積の下に垂直であるΣ I P 、I 、Y I 、Z iは、彼らがないイントロ、高校の幾何学的な意味で直交。通常の内積i Y i Z iを内積として使用していないことに注意してください!Y=E[X]Z=XE[X]iPiYiZiiYiZi


それは本当に良いです!
アントニ・パレラダ

1
答(1)良いが、それは数字を欠いて、またあなたのZが彼らのXですので... OPのために混乱少しかもしれない
アメーバが復活モニカ言う

@MatthewGunn、素晴らしい答え。直交性がユークリッドの意味である表現については、私の答えを以下で確認できます。
YBE

私は鈍感であることを嫌いますが、V a r X 、および論理の方向をまっすぐに保つのに苦労しています(理由は、私にとって意味のない場所に来るからです)。多くの(十分に実証された)事実がランダムに述べられているように感じます。内積はどのスペースにありますか?なぜ1ZVar(X)
ミッチ

@Mitch論理的な順序は次のとおりです。(1)確率空間がベクトル空間を定義することを観察します。ランダム変数をベクトルとして扱うことができます。(2)ランダム変数Zの内積をE [ Y Z ]として定義します。内積空間では、内積がゼロの場合、ベクトルYZは直交として定義されます。(3a)Xを何らかのランダム変数とする。(3b)Y = E [ X ]およびZ = X E [ X ]とする。(4)YおよびZYZE[YZ]YZXY=E[X]Z=XE[X]YZこのように定義されたものは直交しています。(5)Zは直交しているため、ピタゴラスの定理が適用されます。(6)単純な代数により、ピタゴラスの定理は恒等式と同等です。YZ
マシューガン

7

非常に具体的なシナリオの純粋に幾何学的なアプローチに進みます。確率p 1p 2を持つ値{ x 1x 2 }をとる離散値ランダム変数を考えてみましょう。我々はさらに、このランダム変数は、で表すことができると仮定するR 2ベクトルとしてX = X 1 X{x1,x2}(p1,p2)R2X=(x1p1,x2p2)ここに画像の説明を入力してください

長さの二乗はx 2 1 p 1 + x 2 2 p 2であり、これはE [ X 2 ]に等しいことに注意してください。したがって、X = Xx12p1+x22p2E[X2]X=E[X2]

以来、、ベクトルの先端部Xが実際に楕円をトレースします。これにより、p 1およびp 2cos 2θ およびsin 2θ として再パラメーター化すると、わかりやすくなります。したがって、我々はp1+p2=1Xp1p2cos2(θ)sin2(θ)およびp1=cos(θ)p2=sin(θ)

楕円を描く1つの方法は、アルキメデスのトランメルと呼ばれるメカニズムを使用することです。wikiで説明されているように、垂直チャネルまたはレールに閉じ込められた(「トラメル」された)2つのシャトルと、ロッドに沿った固定位置でピボットによってシャトルに取り付けられたロッドで構成されます。シャトルがそれぞれのチャネルに沿って前後に移動すると、ロッドの端が楕円形の経路を移動します。この原理を次の図に示します。

ここで、垂直シャトルがあり、水平シャトルがBにあるときに、このトランメルの1つのインスタンスを幾何学的に分析して、角度θを形成します。建設のため、| B X | = x 2および| A B | = X 1 - X 2θ(ここで、X 1X 2は WLOGを想定しています)。ABθ|BX|=x2|AB|=x1x2θx1x2

ここに画像の説明を入力してください

ロッドに垂直な原点から線を引きましょう。それを示すことができます| O C | = x 1x 2sin θ cos θ 。この特定のランダム変数 V a r X OC|OC|=(x1x2)sin(θ)cos(θ) したがって、垂直距離| OC| 原点からロッドまでは、実際には標準偏差σに等しくなります。

Var(X)=(x12p1+x22p2)(x1p1+x2p2)2=x12p1+x22p2x12p12x22p222x1x2p1p2=x12(p1p12)+x22(p2p22)2x1x2p1p2=p1p2(x122x1x2+x22)=[(x1x2)p1p2]2=|OC|2
|OC|σ

からXまでのセグメントの長さを計算する場合: | C X |CX

|CX|=x2+(x1x2)cos2(θ)=x1cos2(θ)+x2sin2(θ)=x1p1+x2p2=E[X]

三角形OCXでピタゴラスの定理を適用すると、

E[X2]=Var(X)+E[X]2.

要約すると、値を取るすべての可能な離散値のランダム変数を記述するトランメルについて{x1,x2}は、原点からメカニズムの先端までの距離であり、標準偏差σは、ロッドに対する垂直距離です。E[X2]σ

0またはπ / 2の場合、Xは完全に決定論的であることに注意してくださいθπ / 4の場合、最大分散になります。θ0π/2Xθπ/4


1
+1いい答え。そして、ベクトルに確率の二乗を掛けることは、直交性の通常の確率論的概念を直交に見せるためのクールで便利なトリックです!
マシューガン

素晴らしいグラフィック。シンボルのすべてのメイクセンス(トランメルは楕円を記述して、ピタゴラスTHMが適用されます)が、どういうわけか、私は届かない直感的にそれは魔法'は瞬間(スプレッドとセンターどのように関係するかのアイデア与えますか。
ミッチ

トランメルは、すべての可能な値のランダム変数を定義するプロセスと考えてください。ロッドが水平または垂直の場合、確定的なRVがあります。真ん中にはランダム性があり、提案されている幾何学的な枠組みでは、RV(その標準)がロッドから原点までの距離によって正確に測定される方法がわかります。楕円曲線は数学のさまざまなオブジェクトを接続するため、ここにはより深い関係があるかもしれませんが、私は数学者ではないので、その接続を実際に見ることはできません。(x1,x2)
-YBE

3

次のように再配置できます。

Var(X)=E[X2](E[X])2E[X2]=(E[X])2+Var(X)

次に、次のように解釈します。ランダム変数の予想二乗は、その平均の二乗にその平均からの予想二乗偏差を加えたものに等しくなります。


ああ。ほら シンプル。しかし、正方形はまだ解釈されていないように見えます。つまり、正方形がなければ理にかなっているということです(一種、非常に緩やかな)。
ミッチ

3
私はこれで売られていません。
マイケルR.チェルニック

1
ピタゴラスの定理が適用される場合、どの辺の三角形は何で、2本の足はどのように垂直になりますか?
ミッチ

1

適切な答えを詳しく説明するスキルを持っていないことを申し訳ありませんが、答えは物理的な古典力学のモーメントの概念、特に0中心の「生」モーメントと平均中心のモーメントの間の変換にあると思います。分散はランダム変数の2次中心モーメントであることに注意してください。


1

一般的な直観は、適切に定義されたベクトル空間でピタゴラスの定理(PT)を使用してこれらのモーメントを関連付けることができ、2つのモーメントが垂直で、3番目が斜辺であることを示すことです。必要な唯一の代数は、2つの脚が実際に直交していることを示すことです。

以下では、完全な分布のモーメントではなく、計算の目的でサンプルの平均と分散を意味すると仮定します。あれは:

E[X]=1nxi,mean,first central sample momentE[X2]=1nxi2,second sample moment (noncentral)Var(X)=1n(xiE[X])2,variance,second central sample moment

(すべての合計がアイテムを超える場合)。n

参考までに、の基本的な証明は単なるシンボルプッシュです: V a r X Var(X)=E[X2]E[X]2

Var(X)=1n(xiE[X])2=1n(xi22E[X]xi+E[X]2)=1nxi22nE[X]xi+1nE[X]2=E[X2]2E[X]2+1nnE[X]2=E[X2]E[X]2

ここではほとんど意味がなく、代数の基本的な操作にすぎません。は総和内の定数であることに気付くかもしれませんが、それはそれについてです。E[X]

ここで、ベクトル空間/幾何学的解釈/直観で、PTに対応するわずかに再配置された方程式を示します。

Var(X)+E[X]2=E[X2]

したがって、n個のアイテムのサンプルであるR nのベクトルとして考えてください。そして、2つのベクトルE [ X ] 1X E [ X ] 1を作成しましょう。XnRnE[X]1XE[X]1

ベクトルは、すべての座標としてサンプルの平均を持ちます。E[X]1

ベクトルあるX 1 - E [ X ] ... xはN - E [ X ] XE[X]1x1E[X],,xnE[X]

:2つのベクトルのドット積が0であることが判明したので、これらの2つのベクターは、垂直である

E[X]1(XE[X]1)=E[X](xiE[X])=(E[X]xiE[X]2)=E[X]xiE[X]2=nE[X]E[X]nE[X]2=0

したがって、2つのベクトルは垂直です。つまり、それらは直角三角形の2本の足です。

Rn

E[X2]

(XE[X])2+E[X]2=...=E[X2]E[x]1(XE[X])2Var(X)

nnnn

E[X2]

n


また、表面的に類似したバイアス分散トレードオフ方程式の背後にある解釈/直感にも興味があります。誰かそこにヒントがありますか?
ミッチ

piipi=1nipiXiYi=1niXiYiE[XY]XYnipi=1nE[XY]=ipiXiYinE[XY]Pipi=1n

x^y^x^i=xipiy^i=xipix^y^=ixipiyipi=ipixiyi=E[xy]x^y^E[xy]
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.