(これは、Granger&Newbold(1986)「経済時系列の予測」からの適応です)。
構成上、エラーコスト関数はです。これには、重大な仮定(エラーコスト関数はゼロを中心に対称である)が組み込まれています-異なるエラーコスト関数は、期待値のとして条件付き期待値を必ずしも持つとは限りません。未知の数量が含まれているため、エラーコスト関数を最小化できません。そのため、代わりに期待値を最小化することにします。その後、目的関数は引数分[ Y− g(X)]2arg分
E[ Y− g(X)]2= ∫∞- ∞[ y− g(X)]2fY| バツ(y| x)dy
あなたの2番目の質問にも答えると思います。期待値があることになるという直感的である上、条件付き我々は/予想を推定しようとしていることから、に基づいて。正方形を分解して取得しますX Y XYバツYバツ
E[ Y− g(X)]2= ∫∞- ∞y2fY| バツ(y| x)dy− 2 g(X)∫∞- ∞yfY| バツ(y| x)dy+ [ g(X)]2∫∞- ∞fY| バツ(y| x)dy
最初の項は含まないため、最小化には影響せず、無視できます。2番目の項の積分は、与えられた条件付き期待値に等しく、最後の項の積分は1に等しい。そうY Xg(X)Yバツ
arg分g(x )E[ Y− g(X)]2= arg分g(x ){ −2g(X)E(Y∣ X)+[g(X)]2}
1次導関数wrtは、最小化の1次条件になりますが、2次導関数は等しくなります。これは最小限に十分です。− 2 E (Y ∣ X )+ 2 g (X )g (X )= E (Y ∣ X )2 > 0g(X)−2E(Y∣X)+2g(X)g(X)=E(Y∣X)2>0
補遺:「加算および減算」証明アプローチのロジック。
OPは、トートロジー的と思われるため、質問で述べられているアプローチに困惑しています。そうではありません。加算と減算の戦術を使用して、加算と減算される用語の任意の選択に対して目的関数の特定の部分をゼロにしますが、値関数、つまり目的の値を等しくしないからです。候補のミニマイザーで評価される関数。
選択肢の場合、値関数
任意の選択に対して、値funtion。V (E (Y ∣ X )) = E [(Y − E (Y ∣ X ))2 ∣ X ] g (X )= h (g(X)=E(Y∣X)V(E(Y∣X))=E[(Y−E(Y∣X))2∣X]V (h (X )) = E [(Y − h (g(X)=h(X)V(h(X))=E[(Y−h(X))2∣X]
私はそれを主張する
⇒ E (Y 2 | X )- 2 E [(Y E (Y | X ))| X ] + E [(E (Y | X ))2 ∣ X ]
V(E(Y∣X))≤V(h(X))
⇒E(Y2∣X)−2E[(YE(Y∣X))∣X]+E[(E(Y∣X))2∣X]≤E(Y2∣X)−2E[(Yh(X))∣X]+E[(h(X))2∣X]
LHSとRHSの最初の期間はキャンセルされます。また、外側の期待値は条件としていることに注意してください。条件付き期待値の特性により、最終的にはX
。。。⇒ - 2 E(Y∣X)⋅ E(Y∣ X) + [E(Y∣X)]2≤ - 2E(Y∣X)h (X)+ [ h (X)]2
⇒ 0 ≤ [ E(Y∣ X)]2− 2 E(Y∣ X)h (X)+ [ h (X)]2
H (X )≠ E (Y | X )E (Y | X )
⇒ 0 ≤ [ E(Y∣ X)− h (x )]2
場合、厳密な不等式を保持します。したがって、はグローバルでユニークな最小化子です。
h (x )≠ E(Y∣ X)E(Y∣ X)
しかし、これはまた、「加算と減算」のアプローチは、ここで最も明快な証明方法ではないことを示しています。