Hastie、Tibshirani、Friedman によるThe Elements of Statistical Learningのコピーを入手しました。第2章(教師あり学習の概要)セクション4(統計的意思決定理論)では、回帰関数の導出について説明しています。
ましょ表す実数値ランダム入力ベクトル、および関節分布を有する実数値ランダム出力変数、。入力値を指定してを予測するための関数を探します。この理論では、予測でペナルティを課すために損失関数必要であり、最も一般的で便利なのは二乗誤差損失です:です。これにより、を選択するための基準が導かれます。 Y ∈ R PとR (X 、Y )F (X )Y X L (Y 、F (X ))L (Y 、F (X ))= (Y - F (X ))2、F
予想される(二乗)予測エラー。
私はセットアップと動機を完全に理解しています。私の最初の混乱は、彼はまたはを意味しますか?次に、という表記を見たことがない。その意味を私に説明してくれた人はいますか?それだけではある?悲しいかな、私の混乱はそこで終わりません、 E [ (Y − f (x ))2 ] P r (d x 、d y )P r (d x )= P r (x )d x
で条件付けすることにより、をとして記述できますE P E E P E (f )= E X E Y | X([ Y − f (X )] 2 | X )
これら2つのステップの関連性が欠けており、「調整」の技術的な定義に精通していません。何か明確にできることがあれば教えてください!私の混乱のほとんどは、なじみのない表記法から生じたと思います。誰かがこの派生を簡単な英語に分解できれば、私はそれを得ると確信しています。stats.SEに感謝!