私は、統計学習の要素のバイアス分散トレードオフの章を読んでいます。29ページの式には疑問があります(はランダム)期待値と数と分散。モデルの誤差の期待値を E [(Y-f_k(x))^ 2]とします。 ここで、f_k(x)は学習者のxの予測です。本によると、エラーは E [(Y-f_k(x))^ 2] = \ sigma ^ 2 + Bias(f_k)^ 2 + Var(f_k(x))です。
私の質問は、なぜバイアス項が0ではないのですか?エラーの式の開発
独立した乱数である
どこがおかしい?
私は、統計学習の要素のバイアス分散トレードオフの章を読んでいます。29ページの式には疑問があります(はランダム)期待値と数と分散。モデルの誤差の期待値を E [(Y-f_k(x))^ 2]とします。 ここで、f_k(x)は学習者のxの予測です。本によると、エラーは E [(Y-f_k(x))^ 2] = \ sigma ^ 2 + Bias(f_k)^ 2 + Var(f_k(x))です。
私の質問は、なぜバイアス項が0ではないのですか?エラーの式の開発
独立した乱数である
どこがおかしい?
回答:
間違いではありませんが、E [(f(x)-f_k(x))^ 2] \ ne Var(f_k(x))以来、1つのステップでエラーが発生しました。は。
注:
確かに、教科書では、多くの意外な代数が含まれているため、完全な派生物はめったに与えられません。これは、223ページの「統計学習の要素」という本の表記を使用した、より完全な導出です。
私たちがいることを前提とした場合とと我々は回帰適合の期待、予測誤差の式を導き出すことができますの入力における二乗誤差損失を使用して
表記を簡単にするために、、とし、およびことを思い出してください。
用語については、上記と同様のトリックを使用して、を加算および減算して、
それを一緒に入れて
ここアレコスパパドプロスから撮影
はデータポイントに基づいて構築した予測子であることを思い出してくださいなので、と書くことでそれを覚えることができます。
一方、は、上記のデータポイントで構築されたモデルを使用して、新しいデータポイント行う予測です。したがって、平均二乗誤差は次のように記述できます。
前のセクションの方程式を展開する
方程式の最後の部分は次のように見ることができます
我々は、ポイントに関する次の仮定を行うため。