バイアス分散分解:予測二乗予測誤差の項で、既約誤差が少ない


9

ハスティら "統計的学習の要素"(2009)データ生成処理考える Eε = 0ヴァーε = σ 2 εを

Y=f(X)+ε
E(ε)=0Var(ε)=σε2

それらは、点での予想二乗予測誤差の次のバイアス分散分解を示します(p。223、式7.9): Err x 0x0 私自身の仕事で、私は指定されていない Fをが、任意の予測取る yは(これが関連している場合)の代わりに。質問:バイアス2+分散 、より正確には Errx0-既約エラーの用語を探してい ます

Err(x0)=E([yf^(x0)]2|X=x0)==σε2+Bias2(f^(x0))+Var(f^(x0))=Irreducible error+Bias2+Variance.
f^()y^
Bias2+Variance
Err(x0)Irreducible error.

3
ここでの質問は何ですか?
Michael R. Chernick 2017

1
@sntx、アイデアをありがとう。しかし、どういうわけか正しく聞こえません。おそらくモデリングエラー(つまり、モデルの仕様の不正確さとモデルの不正確な推定によるエラー)ですが、予測生成モデル(たとえば、専門家の予測)がない場合は意味がありません。
Richard Hardy

1
@DeltaIV、それはかなり良いです。しかし、私はその用語は有料だと思います。予報が悪いようで、私たちはもっとうまくやれるかもしれません。しかし、与えられたデータに対して最善を尽くしたとします。そのため、たまたま正しいモデル(「モデルバイアス」なし)を選択しましたが、サンプルが小さすぎて係数を完全に推定できません。したがって、推定分散(「モデル分散」)は、指定されたサンプルサイズでは実際には還元できません。「還元誤差」という用語は、そうではないことを示唆しています。より良い用語を考え出すことができると確信しているわけではありませんが、私はそれについて努力したいと思います。
Richard Hardy

1
@ DeltaIV、OK、私は今、それが還元可能であるという直感を得ました。それでも、これ以上説明せずにこの用語を使用すると、誤解を招く可能性があります(私に説明する必要があったのと同じです)。あなたの後者の提案は正確です、それは本当に素晴らしいですが、あなたが言ったように、それはかなり複雑です。
Richard Hardy

1
@DeltaIV、私はそのように聞こえるつもりはありませんでした。これは個人的なことではありません。私の(うまくいけば説得力のある)議論はコメントの中で上にあります。しかし、私と話し合ってくれてありがとう、それは役に立ちます。
リチャードハーディ

回答:


4

削減可能なエラーを提案します。また、これは段落で採用する用語であるの2.1.1 ギャレス、ウィッテン、Hastie&Tibshirani、統計的学習への入門、基本的に彼らが使用するという事実を除いて、ESL +いくつかの非常にクールなRコード研究所の簡素化(あるブックattach、しかし、ねえ、誰も完璧ではありません)。この用語の長所と短所の理由を以下に示します。


ϵXϵXHσϵ2

Err(x0)σϵ2

f(x)=E[Y|X=x]

E[Y|X=x]HE[Y|X=x]Hf^(x) 私たちのモデルの家族で。

HE[Y|X=x]σϵ2HϵX


ノイズが既約エラーである場合、それは既約ではありません。どういうわけかこれをやる気にさせる必要があります、私は自分でそれをすることはできません。
カール

2.1.1の例は、「血中の薬物の分析」です。以下に示す最初の例は、まさにそれです。このアッセイでは、いわゆる測定の既約誤差はそのようなものではありません。これは、通常10000以上のイベントをカウントすることで減少するノイズのカウント、ほぼ指数関数的に分布するピペッティングエラー、およびその他の技術的エラーで構成されます。これらの「還元不可能な」エラーをさらに減らすために、時間サンプルごとに3つのカウンティングチューブの中央値を使用することをお勧めします。既約という用語は悪い専門用語です。もう一度やり直してください。
カール

1
@Delta、回答ありがとうございます。ワンライナーの「削減可能なエラー」はあまり説得力がなかったかもしれませんが、コンテキストと議論を考えると、それはかなり良く見えます!
リチャードハーディ

nn

@DeltaV還元性は疑わしい仮定であると私は信じています。以下を参照してください。
カール

0

1R2ynn

「還元可能性」という用語が気に入らないのはなぜですか?これは、還元可能性公理のように自己参照トートロジーをたたく。私は同意するラッセル1919ことを、私はそれがすべての可能世界で真であることを言うことによって意味されるものである還元性の公理が論理的に必要であると信じる理由が、表示されません」。のシステムにこの公理の入場したがって、論理は欠陥であり、疑わしい仮定です。」

n=36

ここに画像の説明を入力してください

注目すべきは、最初のサンプルを5分で落とすと、初期のサンプルを60分まで落とし続けるのと同じように、物理が順次改善することです。これは、GVが最終的には薬物の血漿濃度の優れたモデルを形成するものの、他の何かが初期に起こっていることを示しています。

1%

ここに画像の説明を入力してください

y


確かに、これは上記の分解についてです。しかし、あなたの答えは実際の質問を扱っていないので、コメントとして役立つでしょう。それとも?
リチャードハーディ

Bias2+Variance

もう一度、あなたは別の質問に答えています。間違った質問に対する正しい答えは、残念ながら間違った答えです(自己への注記:偶然にも、私は昨日、これを学部生に説明していました)。この表現がどれほど意味があるか(ESLの教科書を読んだり、応用機械学習で働いたりした人にとって意味がある)については尋ねていません。適切な用語を求めています。質問は肯定的であり、規範的ではありません。そして、それはかなりシンプルで非常に具体的です。
リチャードハーディ

@RichardHardy物理学がなければ、質問を理解するのは困難でした。私の答えを変更しました。上記の誤登録をご覧ください。
カール

1
プロセスを推定するためにそれを行うことができます。そうです。これは、削減可能なエラーの部分です。しかし、コインフリップを含む具体的なイベントを予測する場合、コインフリップの結果の誤予測に関連するエラーを減らす方法はありません。これが既約エラーです。興味深い:純粋に決定論的な世界では、定義によって還元不可能なエラーはないので、世界の見方が完全に決定論的である場合、私はあなたの意味を理解するかもしれません。しかし、世界は「統計的学習の要素」と統計全般において確率論的です。
リチャードハーディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.