方程式(2.11)は、次の小さな等式の結果です。任意の2つのランダム変数およびZ 2、および任意の関数gZ1Z2g
EZ1,Z2(g(Z1,Z2))=EZ2(EZ1∣Z2(g(Z1,Z2)∣Z2))
表記は、共同分布に対する期待値です。表記法E Z 1 ∣ Z 2は、本質的に「Z 2が固定されているかのようにZ 1の条件付き分布を積分する」と言います。EZ1,Z2EZ1∣Z2Z1Z2
とZ 2が離散ランダム変数である場合、関係する定義を巻き戻すだけでこれを確認するのは簡単ですZ1Z2
EZ2(EZ1∣Z2(g(Z1,Z2)∣Z2))=EZ2(∑z1g(z1,Z2)Pr(Z1=z1∣Z2))=∑z2(∑z1g(z1,z2)Pr(Z1=z1∣Z2=z2))Pr(Z2=z2)=∑z1,z2g(z1,z2)Pr(Z1=z1∣Z2=z2)Pr(Z2=z2)=∑z1,z2g(z1,z2)Pr(Z1=z1,Z2=z2)=EZ1,Z2(g(Z1,Z2))
連続的なケースは、この議論の制限として非公式に見ることも、すべての測定理論的父親が設定されたら正式に検証することもできます。
アプリケーションを解くには、、Z 2 = X、およびg (x 、y )= (y − f (x ))2を取ります。すべてが正確に並んでいます。Z1=YZ2=Xg(x,y)=(y−f(x))2
アサーション(2.12)は、最小化を検討するように求めています
EXEY∣X(Y−f(X))2
ここでは、を自由に選択できます。繰り返しますが、個別のケースに焦点を当て、上記の巻き戻しの途中までドロップすると、最小化されていることがわかります。f
∑x(∑y(y−f(x))2Pr(Y=y∣X=x))Pr(X=x)
大きな括弧内のすべては非負であり、加数を個別に最小化することで非負の量の合計を最小化できます。コンテキストでは、これは選択できることを意味しますf
∑y(y−f(x))2Pr(Y=y∣X=x)
x