回帰関数の導出によって混乱


9

Hastie、Tibshirani、Friedman によるThe Elements of Statistical Learningのコピーを入手しました。第2章(教師あり学習の概要)セクション4(統計的意思決定理論)では、回帰関数の導出について説明しています。

ましょ表す実数値ランダム入力ベクトル、および関節分布を有する実数値ランダム出力変数、。入力値を指定してを予測するための関数を探します。この理論では、予測でペナルティを課すために損失関数必要であり、最も一般的で便利なのは二乗誤差損失です:です。これにより、を選択するための基準が導かれます。 Y R PとR X Y F X Y X L Y F X L Y F X = Y - F X 2、FXRpYRPr(X,Y)f(X)YXL(Y,f(X))L(Y,f(X))=(Yf(X))2f

EPE(f)=E(Yf(X))2=[yf(x)]2Pr(dx,dy)
予想される(二乗)予測エラー。

私はセットアップと動機を完全に理解しています。私の最初の混乱は、彼はまたはを意味しますか?次に、という表記を見たことがない。その意味を私に説明してくれた人はいますか?それだけではある?悲しいかな、私の混乱はそこで終わりません、 E [ Y f x 2 ] P r d x d y P r d x = P r x d xE[(Yf(x))]2E[(Yf(x))2]Pr(dx,dy)Pr(dx)=Pr(x)dx

で条件付けすることにより、をとして記述できますE P E E P E f = E X E Y | X[ Y f X ] 2 | X XEPE

EPE(f)=EXEY|X([Yf(X)]2|X)

これら2つのステップの関連性が欠けており、「調整」の技術的な定義に精通していません。何か明確にできることがあれば教えてください!私の混乱のほとんどは、なじみのない表記法から生じたと思います。誰かがこの派生を簡単な英語に分解できれば、私はそれを得ると確信しています。stats.SEに感謝!

回答:


11

最初の混乱のために、それは二乗誤差の期待であるべきなので、それはE[(Yf(x))2].

の表記では、と同じです。ここで、はxとyの結合pdfです。そして、これはxが小さな間隔内にある確率が点でのpdf値と等しい、すなわち間隔の長さます。Pr(dx,dy)g(x,y)dxdyg(x,y)Pr(dx)=f(x)dx[x,x+dx]xf(x)dx

EPEに関する方程式は、任意の2つの確率変数およびの定理に由来します。条件付き分布を使用してこれを証明できます。条件付き期待値は、条件付き分布を使用して計算された期待値です。条件付き分布は、について何かを知った後のの確率を意味します。X Y Y | X Y XE(E(Y|X))=E(Y)XYY|XYX

この例では、2乗誤差を関数として表すとすると、EPEはL(x,y)=(yf(x))2

E(L(x,y))=L(x,y)g(x,y)dxdy=[L(x,y)g(y|x)g(x)dy]dx=[L(x,y)g(y|x)dy]g(x)dx=[EY|X(L(x,y)]g(x)dx=EX(EY|X(L(x,y)))

上記の結果は、リストした結果に対応しています。これが少し役立つことを願っています。


1
条件付け後の最終結果については、本にも| Xが含まれていますが、この回答の最終結果には欠落しています。大切ですか?
robertmartin8 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.