状況がないと言っても安全だと思います 公平な見積もりが必要な。たとえば、μ = 1 そして私たちは持っています E[μ^]=μ+ϵ、ある ϵ あなたがおそらく気にすることができないほど十分に小さい。
そうは言っても、公平な推定量を良いものの限界のより多くとして見ることが重要だと思います。他はすべて同じままバイアスが少ないほど優れています。また、適度なサンプルではバイアスが非常に高く、推定量に大きな影響を与える一貫した推定量がたくさんあります。たとえば、ほとんどの最尤推定量では、分散成分の推定値はしばしば下向きにバイアスされます。たとえば、予測間隔の場合、これは過剰適合に直面して本当に大きな問題になる可能性があります。
要するに、私は本当に本当に公平な見積もりが必要な。ただし、推定量の偏りが重大な問題であるという問題は非常に簡単に発生します。推定者を公平にすることはおそらく絶対的な要件ではありませんが、推定者を公平にすることは、1つの潜在的に深刻な問題に対処する必要があることを意味します。
編集:
もう少し考えてみたところ、サンプル外のエラーがリクエストの完璧な答えであることがわかりました。標本外誤差を推定するための「古典的な」方法は、最尤推定量であり、通常のデータの場合、標本内誤差に減少します。この推定量は一貫していますが、自由度が大きいモデルではバイアスが非常に悪いため、縮退モデルが推奨されます(つまり、適合度が非常に高いモデルではサンプル外誤差0を推定します)。相互検証は、サンプル外エラーの公平な推定値を得る賢い方法です。相互検証を使用してモデルの選択を行う場合、サンプル外の誤差推定に再び下向きのバイアスをかけます...そのため、検証データセットを保持して、最終的に選択されたモデルの不偏推定を取得します。
もちろん、本当に公平なものについての私のコメントはまだ残っています:推定者がサンプル外エラーの期待値を持っていた場合+ ϵ、私は代わりに十分に小さいので喜んでそれを使います ϵ。しかし、相互検証の方法は、サンプル外エラーの公平な推定量を取得しようとすることによって動機付けられています。また、相互検証を行わないと、機械学習の分野は現在とはまったく異なるものになります。