ML推定量は、データセットで発生する可能性が最も高いパラメーターの値をもたらします。
仮定を考えると、ML推定量は、データセットを生成する可能性が最も高いパラメーターの値です。
「パラメータの最も可能性の高い値は、間違った値への偏りがあるパラメータの実際の値をどのように予測できるか」という意味で、偏ったML推定量を直感的に理解できません。
バイアスは、サンプリング分布の期待に関するものです。「データを生成する可能性が最も高い」とは、サンプリング分布の期待に関するものではありません。なぜ彼らは一緒に行くことが期待されますか?
それらが必ずしも一致しないという驚くべき根拠は何ですか?
MLEのいくつかの単純なケースを検討し、それらの特定のケースでどのように違いが生じるかを熟考することをお勧めします。
例として、上のユニフォームでの観測を考えます。最大の観測値は(必然的に)パラメーターより大きくないので、パラメーターは少なくとも最大の観測値と同じ大きさの値しか取得できません。(0 、θ )
の尤度を考慮すると、が最大の観測値に近いほど(明らかに)大きくなります。したがって、最大の観測で最大化されます。それは明らかに、取得したサンプルを取得する機会を最大化するの推定値です。θθθ
しかし、一方で、最大の観測値は明らかに(確率1で)真の値よりも小さいため、バイアスをかける必要があります。サンプル自体によってまだ除外されていないその他の推定値はそれより大きくなければならず、(この場合は明らかに)サンプルを生成する可能性は低くなければなりません。θθθ
からの最大の観測値の期待値はであるため、バイアスを解除する通常の方法は:推定量として取得することです。、ここでは最大の観測値です。nうん(0 、θ ) θ θ =N+1nn + 1θX(n)θ^= n + 1nバツ(n )バツ(n )
これはMLEの右側にあるため、可能性は低くなります。