一貫した推定量の数学的定義はすでに理解していると思います。私が間違っている場合は修正してください:
場合、は一貫した推定量です
ここで、はパラメトリック空間です。しかし、私は推定量が一貫している必要性を理解したいと思います。一貫性のない推定量が悪いのはなぜですか?例を挙げていただけますか?
Rまたはpythonでのシミュレーションを受け入れます。
一貫した推定量の数学的定義はすでに理解していると思います。私が間違っている場合は修正してください:
場合、は一貫した推定量です
ここで、はパラメトリック空間です。しかし、私は推定量が一貫している必要性を理解したいと思います。一貫性のない推定量が悪いのはなぜですか?例を挙げていただけますか?
Rまたはpythonでのシミュレーションを受け入れます。
回答:
n = 10と考える標準コーシー分布からの 000の観測。これは、1自由度のスチューデントのt分布と同じです。この分布の裾は十分に重いため、意味がありません。分布は中央値 η = 0を中心としています。
サンプルのシーケンスは、A j = 1を意味しますはコーシー分布の中心に対して一貫性がありません。大雑把に言えば、非常に極端な観測(正または負)が十分な規則性で発生するため、がに収束する可能性はありません(は収束が遅いだけでなく、 tはこれまでに収束する。の分布jが再び標準コーシー[プルーフ])。
これとは対照的に、継続的なサンプリングプロセスのいずれかの段階で、観測値の約半分はのいずれかの側にあるだろうシーケンスのようにサンプル中央値のが収束するん
この収束との収束の欠如は、次のシミュレーションによって示されます。
set.seed(2019) # for reproducibility
n = 10000; x = rt(n, 1); j = 1:n
a = cumsum(x)/j
h = numeric(n)
for (i in 1:n) {
h[i] = median(x[1:i]) }
par(mfrow=c(1,2))
plot(j,a, type="l", ylim=c(-5,5), lwd=2,
main="Trace of Sample Mean")
abline(h=0, col="green2")
k = j[abs(x)>1000]
abline(v=k, col="red", lty="dotted")
plot(j,h, type="l", ylim=c(-5,5), lwd=2,
main="Trace of Sample Median")
abline(h=0, col="green2")
par(mfrow=c(1,1))
以下がステップのリストですこれらの極端な観測値の一部が、左側のプロット(赤い赤い点線)の移動平均に及ぼす影響を確認できます。
k = j[abs(x)>1000]
rbind(k, round(x[k]))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
k 291 898 1293 1602 2547 5472 6079 9158
-5440 2502 5421 -2231 1635 -2644 -10194 -3137
推定において重要な一貫性:コーシー母集団からのサンプリングでは、n = 10のサンプルのサンプル平均観測値は、1つの観測値よりも中心を推定するのに適しています。対照的に、一貫したサンプル中央値は収束するため、サンプルが大きいほど、より良い推定値が生成されます。
一貫性を考えることが重要である理由の実に簡単な例は、私が十分な注意を引くとは思わないが、単純化したモデルのそれです。
理論的な例として、真の効果が実際には非線形であるいくつかのデータに線形回帰モデルを当てはめたいとします。その場合、予測は共変量のすべての組み合わせの真の平均と一致することはできませんが、より柔軟な方法は可能です。つまり、単純化されたモデルには、より多くのデータを使用しても克服できない欠点があります。
@BruceETはすでに優れた技術的な答えを出しましたが、それについての解釈についてのポイントを付け加えたいと思います。
統計の基本概念の1つは、サンプルサイズが大きくなると、基礎となる分布についてより正確な結論に達することができるということです。これは、大量のサンプルを取得することでデータのランダムなジッターを排除するという概念と考えることができます。そのため、基礎となる構造のより良い概念が得られます。
さて、また、このルールに従うことを要求している矛盾しないように推定量を必要とする:その仕事は未知パラメータを推定することであるように、我々はそのパラメータに収束することを希望(読み:見積りをその恣意もパラメータ)私たちのサンプルとして、サイズは無限大になる傾向があります。
方程式