*統計学習入門*の*関数*の分散とはどういう意味ですか?


11

pg。統計学習入門の 34 :

数学的な証明は本書の範囲を超えているものの、期待されるテストMSEは、与えられた値のためにあることを示すことが可能である:、常に3つの基本的な量の和に分解することができる分散FX 0、二乗バイアスFX 0と誤差項の分散ε。あれは、x0f^(x0)f^(x0)ε

E(y0f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ε)

[...]分散は、それによって量を意味するfは、我々は異なるトレーニングデータセットを使用して、それを推定した場合に変更します。f^

質問:ので、の分散表しているようだ機能を、何が正式にこれが意味するのでしょうか?Var(f^(x0))

つまり、私は確率変数分散の概念に精通していますが、関数のセットの分散はどうですか?これは、値が関数の形式を取る別の確率変数の分散と考えることができますか?X


6
f^x0 f^(x0)f^

2
f^f^(x0)

この教科書の著者は誰ですか。私はこの件について自分で学びたいと思っていましたが、参考にしていただければ幸いです。
Chill2Macht

3
@WilliamKrinsmanこれは本です:www-bcf.usc.edu/~gareth/ISL
Matthew Drury

回答:


13

@whuberとの対応は正しいです。

A

A:T{ff:XR}

Tfx

x0

Ax0(T)=A(T)(x0)

Tx0


5

繰り返しkfoldsを使用した視覚的解釈

@Matthew Druryの答えを視覚的/直感的に解釈するには、次のおもちゃの例を考えてみてください。

  • f(x) +
  • データはトレーニングサンプルとテストサンプルに分割されます(75%-25%)
  • f^(x)
  • プロセスは同じデータを使用して何度も繰り返されます(つまり、分割トレーニング-Sklearmの繰り返しkfoldを使用してランダムにテストします)
  • x=xi

2次と6次の多項式モデルの結果のグラフについては、以下を参照してください。一見すると、多項式(赤)が高いほど分散が大きいようです。

ここに画像の説明を入力してください

赤いグラフの分散が大きいと主張-実験的に

f^gf^rf^(i)nxmn=400m=200

主なシナリオは3つあります

  1. x=x0Var [{f^r(1)(x0),...,f^r(m)(x0)}]>Var [{f^g(1)(x0),...,f^g(i)(x0)}]
  2. (1) {x1,...,x400}(0,1)
  3. 分散は平均で大きくなります(つまり、一部のポイントでは小さくなる場合があります)。

(0,1)

オープンエンドの結論

上記の3つのシナリオがすべて当てはまるわけではない場合に議論すべきことは何ですか。たとえば、赤の予測の分散が平均では大きいが、すべてのポイントではない場合はどうでしょうか。

ラベルの詳細

ポイント考慮x0=0.5

  • f^(x0)
  • x0
  • f(x)

x=0.95,

xx

はい、同意します
Xavier Bourret Sicotte 2018
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.