質問
場合 IID、次いで計算され、ここで、。X 1、⋯ 、X N〜N(μ 、1 )
X1,⋯,Xn∼N(μ,1) E (X 1 | T )E(X1∣T) T = Σ I X IT=∑iXi
試行:以下が正しいかどうかを確認してください。
たとえば、
これは、X_1、\ ldots、X_nがIIDである、各ことを意味します。Σ I E(X I |T) =E(Σ I X I |T) =T。
したがって、E (X 1 ∣ T ) = Tn
質問
場合 IID、次いで計算され、ここで、。X 1、⋯ 、X N〜N(μ 、1 )
X1,⋯,Xn∼N(μ,1) E (X 1 | T )E(X1∣T) T = Σ I X IT=∑iXi
試行:以下が正しいかどうかを確認してください。
たとえば、
これは、X_1、\ ldots、X_nがIIDである、各ことを意味します。Σ I E(X I |T) =E(Σ I X I |T) =T。
したがって、E (X 1 ∣ T ) = Tn
回答:
アイデアは正しいが、それをもう少し厳密に表現するという問題がある。したがって、表記法とアイデアの本質を明らかにすることに焦点を当てます。
確率変数ある交換可能な置換変数の分布は、すべての可能な置換すべて同じです。X = (X 1、X 2、... 、X N)
X=(X1,X2,…,Xn) X σ = (X σ (1 )、X σ (2 )、... 、X σ (N ))σXσ=(Xσ(1),Xσ(2),…,Xσ(n)) σ
明らかにiidは交換可能を意味します。
表記の問題として、のコンポーネントにを記述し、X σ I = X σ (I )
してみましょう任意のインデックスでとlet BE任意の順列送信指標のに (このようなaが 1が常にちょうど入れ替えることができますので、存在および)の交換性意味しますJ
E [ X 1 | T ] = E [ X σ 1 | T σ ] = E [ XのJ | T ] 、
(最初の不等式で)を同じ分布ベクトル置き換えただけだからですこれが問題の核心です。X
その結果
T = E [ T ∣ T ] = E [ n ∑ i = 1 X i ∣ T ] = n ∑ i = 1 E [ X i ∣ T ] = n ∑ i = 1 E [ X 1 ∣ T ] = n E [ X 1 ∣ T ] 、
どこから
E [ X 1 ∣ T ] = 1nT.
ましょとので、。次に、というイベントをいくつかので条件付けているので、これはサポートされている多変量ガウス分布を描画するようなものですが、アフィンに終わるものだけを見ることになります空間。次に、このアフィン空間に到達するポイントの座標の平均を知りたいと思います(メジャーゼロサブセットであることを気にしないでください)。X=(X1,…,Xn)T
私たちは知っている
我々は一定の平均ベクトルと球状ガウスを持っているので、平均ベクトル超平面の法線ベクトルと同じ行にあります。X∼N(μ1,I)
重要なアイデア:最初にアフィン部分空間上の密度を想像してください。密度周りに対称であるので。密度も上に対称になりようまた、同じライン上に対称であり、それは対称でその周りの点は線の交点であると。これは起こります。Ht:={x:xT1=t}
を描くために、何度もサンプリングを想像できます。そして、ポイントを取得するたびに、座標だけを取得して保存します。の密度の対称性から、座標の分布も対称になり、同じ中心点を持ちます。対称分布の平均は対称の中心点であるため、これは意味し、とは影響を受けずに拡張できるため、を意味します。何でも。E(X1|T)
高次元では、これを正確に視覚化することは困難(または不可能)になりますが、同じ考え方が適用されます。平均が球面ガウスを取得し、それに垂直なアフィン部分空間を見ています。部分空間上の分布の均衡点は依然としての交差点であろうとである、および密度はまだ対称であるため、このバランスポイントは再び平均です。1
繰り返しになりますが、これは証拠ではありませんが、そもそもなぜこの動作を期待するのかについて、まともな考えを与えると思います。
これを超えて、@ StubbornAtomなどの一部が指摘しているように、実際にはがガウスである必要はありません。2-Dでは、が交換可能な場合、(より一般的には)であるため、は線上で対称でなければならないことに注意してください。また、ので、最初の図の「キーアイデア」に関して私が言ったことはすべてそのままです。が混合ガウスモデルのiid である例を次に示します。すべての行の意味は以前と同じです。X
あなたの答えは正しいと思いますが、あなたの証明のキラーラインについては完全にはわかりませんが、それは「彼らはiidだから」本当です。同じソリューションへのより冗長な方法は次のとおりです。
実際の意味を考えてください。N個の読み取り値を持つサンプルがあり、その平均値がTであることを知っています。これが実際に意味するのは、サンプリングされた基礎となる分布はもはや重要ではないということです。あなたの証明のガウスからサンプリングされた)。E(xi|T)
E(xi|T)