バイアスのない効率的な推定量は、他の(中央値の)バイアスのない推定量よりも確率的に支配的ですか?


9

概要

効率的な推定量(サンプル分散がCramér–Rao限界に等しい)は、真のパラメーターθに近い確率を最大化しますか?

私たちは見積もりと真のパラメータの違いや絶対差を比較すると言いますΔ = θ - θ

Δ^=θ^θ

分布であるΔ効率的な推定のためには、確率的に支配的なの分布オーバーその他の不偏推定のために?Δ^Δ~


動機

ため、私は質問のこの考えていますすべての賢明な損失(評価)関数の下で最適な見積もりから(私たちは1つの凸損失関数に関して公平最良推定量は、他の損失関数に関して公平最良推定量でもあると言うことができますIosif Pinelis、2015年、最高の不偏推定量の特性 。arXivプレプリントarXiv:1508.07636)。真のパラメータに近い確率的優位性は、私と似ているようです(これは十分な条件であり、より強力なステートメントです)。


より正確な表現

上記の質問文は幅広いものです。たとえば、どの種類の不偏性が考慮され、負と正の差について同じ距離測定基準がありますか?

次の2つのケースについて考えてみましょう。

予想1:もし、効率的な平均値と中央値、不偏推定量です。次に、任意の平均および中央値不偏推定量 where and θ^θ~

if x>0 then P[Δ^x]P[Δ~x]if x<0 then P[Δ^x]P[Δ~x]
Δ = θ - θ Δ = θ - θΔ^=θ^θΔ~=θ~θ

予想2:もし効率的な平均不偏推定量です。次に、平均不偏推定量およびθ^θ~x>0

P[|Δ^|x]P[|Δ~|x]

  • 上記の推測は正しいですか?
  • 命題が強すぎる場合、それを機能させるためにそれらを適応させることができますか?

2つ目は1つ目と関連していますが、中央値の不偏性の制限を削除します(両方の側を一緒にする必要があります。そうしないと、効率的な推定量とは異なる中央値を持つ推定量に対して、命題が偽になります)。


例、イラスト:

(1)標本中央値と(2)標本平均による母集団の分布の平均(正規分布であると見なされます)の推定を考慮してください。μ

サイズ5の標本の場合、母集団の真の分布が、次のようになります。N(0,1)

cdfの例

画像では、サンプル平均のフォールドCDF(効率的な推定量)がサンプル中央値のフォールディングCDFの下にあることがわかります。問題は、サンプル平均のフォールドCDFが他の不偏推定量のフォールドCDFを下回っているかどうかです。μ

または、折りたたまれたCDFではなくCDFを使用して、平均のCDFがすべての点で0.5からの距離を最大化するかどうかを質問できます。私たちは知っている

θ^:|Fmean(θ^)0.5||Fmedian(θ^)0.5|

を他の平均および中央値に偏りのない推定値の分布に置き換えたときにも、これはありますか?Fmedian(θ^)


2
Pitman nearnessキーワードを確認してください。この基準が特に理にかなっているとは限りません。
西安

1
推測から、平均不偏推定量より中央値不偏推定量を使用する方が合理的であるように思われます。(偏りのない推定量は、いくつかの設定で存在し、さらに少ない設定で最も公平です。)
西安

1
「ピットマンの接近基準」は確かに興味深いものです。ウィキペディアの情報に基づいて、私はそれを「絶対的な差がより近くなる確率」と見なします。ただし、少し異なります。このピットマンの接近基準は、一部の推定者の平均絶対差が小さいものの、この接近基準に従って勝利しない興味深いケースを作成する可能性があります。
Sextus Empiricus

1
θ^θ~θθ~θθ

1
@ Xi'an視覚的な例を追加しましたが、中央値の偏りと平均値の偏りについてのコメントを受け取りました。私は質問を調整しました(ただし、リンクされた質問に関連する私の元のアイデアから離れていますが、今は、より複雑な調整が必要です)。
Sextus Empiricus

回答:


5

(X1,,XN)C(μ,1)μ

  1. μ^1=median(X1,,XN)=X(N/2)
  2. μ^2=mean(X(N/4),,X(3N/4))=2N(X(N/4)++X(3N/4))
  3. μ^3=μMLE
  4. μ^4=μ^1+2Nμ(μ^1)

μ^3μ^4μ^1μ^2ここに画像の説明を入力してください

MLEの経験的累積分布関数との違いを表すと、より明確になります。

ここに画像の説明を入力してください

対応するRコードは次のとおりです。

T=1e4
N=11
mlechy=function(x){
  return(optimize(function(theta) -sum(dcauchy(x, 
    location=theta, log=TRUE)),  c(-100,100))$minimum)
}
est=matrix(0,T,4)
for (t in 1:T){
cauc=sort(rcauchy(N))
est[t,1]=median(cauc)
est[t,2]=mean(cauc[4:8])
est[t,3]=mlechy(cauc)
est[t,4]=est[t,1]+(4/N)*sum((cauc-est[t,1])/(1+(cauc-est[t,1])^2))
}

plot(ecdf(est[,1]),col="steelblue",cex=.4,xlim=c(-1,1),main="",ylab="F(x)")
plot(ecdf(est[,2]),add=TRUE,col="sienna",cex=.4)
plot(ecdf(est[,3]),add=TRUE,col="gold",cex=.4)
plot(ecdf(est[,4]),add=TRUE,col="tomato",cex=.4)

1
差のプロットでは、ゴールドカーブ(経験的MLEとそれ自体の差)がゼロであってはなりません。
Sextus Empiricus

私の悪いことに、私はカラーコードを変更しました。トマトは4番目との違い、ゴールドはピットマンとの違い、シエナはトリミングされた平均との違い、そして青は中央値との違いです。
西安
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.