MLEが平均のバイアス推定値を生成する例はありますか?


17

偏った平均のMLE推定量の例を提供できますか?

規則性の条件に違反することでMLE推定量を一般的に破る例は探していません。

私がインターネットで見ることができるすべての例は分散を参照します、そして、私は平均に関連する何かを見つけることができないようです。

編集

@MichaelHardyは、特定の提案モデルでMLEを使用して均一分布の平均のバイアス推定値を取得する例を提供しました。

しかしながら

https://en.wikipedia.org/wiki/Uniform_distribution_(continuous)#Estimation_of_midpoint

MLEは、明らかに別の提案モデルの下で、平均の一様に最小の不偏推定量であることを示唆しています。

この時点で、モデル中立であるサンプル平均推定量とは対照的に、非常に仮説的なモデル依存である場合、MLE推定が何を意味するのかはまだ明確ではありません。最後に、母集団について何かを推定することに興味があり、仮説モデルのパラメーターの推定についてはあまり気にしません。

編集2

@ChristophHanckが追加情報でモデルを示したため、バイアスが導入されましたが、MSEを減らすことができませんでした。

また、追加の結果があります。

http://www.maths.manchester.ac.uk/~peterf/CSI_ch4_part1.pdf(p61) http://www.cs.tut.fi/~hehu/SSP/lecture6.pdf(スライド2) http:/ /www.stats.ox.ac.uk/~marchini/bs2a/lecture4_4up.pdf(スライド5)

「θの最も効率的な不偏推定量ˆθが存在する場合(すなわちˆθが不偏であり、その分散がCRLBに等しい場合)、推定の最尤法はそれを生成します。」

「さらに、効率的な推定量が存在する場合、それはML推定量です。」

自由なモデルパラメーターをもつMLEは偏りがなく効率的であるため、定義上、この "the"最尤推定量は?

編集3

@AlecosPapadopoulosの数学フォーラムには、半正規分布の例があります。

/math/799954/can-the-maximum-likelihood-estimator-be-unbiased-and-fail-to-achieve-cramer-rao

均一な場合のように、そのパラメーターを固定していません。彼は平均推定量のバイアスを実証していませんが、それで解決すると言うでしょう。


10
ゼロとシータ上のユニフォームの平均。
クリストフハンク

1
「母集団について何かを推定する」と「仮説モデルのパラメーター」の区別はできません。すべてのパラメトリック統計では、いくつかのパラメーターで母集団をパラメーター化します。もちろん、このように仕様の間違いの問題に遭遇する可能性がありますが、それは目下の問題に関連するとは思われません。
クリストフハンク

5
たとえば、母集団は、平均や分散などのパラメータ/モーメントによって特徴付けられます(たとえば、通常の母集団には十分です)。そして:私は、このフォーラムの他の誰よりも、あなたが人々に対して多かれ少なかれ慢であるとは思いません。
クリストフハンク

2
「パラメータ」と「平均」の間の切り替えの見かけの手足に不満を感じている場合、その平均に関して特定の非負の分布を定義してみましょう。密度は1です。μのその支持体上に[02μ]...12μ[0,2μ]
シミ

1
編集2については、これらの結果の多くは、このスレッドで説明されている均一な例では満たされていない規則性条件の下で導出され、サンプルスペースはパラメーターに依存します。
クリストフハンク

回答:


32

クリストフ・ハンクは、提案された例の詳細を掲載していません。私は彼が間隔の均一な分布を意味し、それを取る IIDサンプルに基づいてX 1... X nは以上のサイズのN = 1。[0,θ],X1,,Xnn=1.

平均はです。θ/2

max{X1,,Xn}/2.

これは、なのでバイアスされているため、E max / 2 < θ / 2。Pr(max<θ)=1,E(max/2)<θ/2.

PS:おそらく、平均の最適な不偏推定量はサンプル平均ではなく、サンプル平均はお粗末な推定量です。一部のサンプルでは、​​サンプル平均が未満あり、明らかに不可能です。未満になりますPSの終わりn + 1θ/2θ/21

n+12nmax{X1,,Xn}.
θ/2θ/2max/2。12max{X1,,Xn},θ/2max/2.

パレート分布もそのようなケースだと思います。確率の尺度は次のとおりです。 期待される値は期待値のMLEは α

α(κx)α dxx for x>κ.
nαα1κ.={X1...XN}
nni=1n((logXi)log(min))min
min=min{X1,,Xn}.

平均値に対するMLEの期待値を算出していないため、そのバイアスが何であるかわかりません。


12
Cagdas、countexampleを要求し、それからあなたが何か他のものを提案することを否定することは合法ではありません!これは、赤い果実ではなく、ブルーベリーが表示されている果物の例を求め、ブルーベリーが好きではないので数えないと言っているようなものです。
whuber

7
それはあなたが尋ねた質問とは関係ありません。
whuber

8
@CagdasOzgenc:MLEがバイアスされているかどうかは、モデルに依存します。モデルのないMLEのようなものはありません。モデルを変更すると、MLEも変更されます。
マイケルハーディ

8
@CagdasOzgencここにソクラテスの質問があります:サンプル平均は何の公平な推定量ですか?推定するパラメーターを持つモデルが必要です。
マシュードゥルーリー

9
iid標本の平均は母平均の不偏推定量ですが、何かの不偏推定量について話すために必要なものよりも多くの構造がない限り、最尤推定量については言えません。
マイケルハーディ

18

これは、一部の人が驚くかもしれないと思う例です:

ロジスティック回帰では、非決定的結果(つまり、)の有限サンプルサイズの場合、推定回帰係数は偏っているだけでなく、回帰係数の平均は実際には定義されていません。0<pi<1

これは、サンプルサイズが有限である場合、結果の完全な分離を得るための正の確率(サンプル数が回帰パラメーターの数と比較して非常に小さい場合)があるためです。これが発生すると、推定回帰係数はまたはいずれかになります。またはいずれかの正の確率は、期待値が未定義であることを意味します。-

この特定の問題の詳細については、Hauck-Donner-effectを参照してください。


1
これは非常に賢い方法です。ロジスティック回帰係数のMLEは、Hauck-Donner効果の非発生を条件とするバイアスがかけられているのだろうか?
GUNG -復活モニカ

3
@gung:簡単な答え:Hauck-Donner効果を無視すると、絶対回帰係数にはまだ上向きのバイアスがあります(つまり、負の係数には下向きのバイアスがあり、正の係数には上向きのバイアスがあります)。興味深いことに、推定確率には0.5に偏っているようです。私はこの投稿でそれについて書き始めましたが、推定された確率のバイアスについての結果を出していません。
クリフAB

10

@MichaelHardyが指摘しましたが、最大のMLE(したがって、不変による平均のMLE )が別のモデル(以下の編集をご覧ください)。θ/2

一様分布の上限を推定します。ここで、 はランダムサンプル MLE です。偏りがないことを示します。そのは したがって、その密度は したがって、 y n y y n F y n x U[0,θ]y(n)yy(n) FYNX={N

Fy(n)(x)=Pr{Y1x,,Ynx}=Pr{Y1x}n={0forx<0(xθ)nfor0xθ1forx>θ
E [ Y n ]
fy(n)(x)={nθ(xθ)n1for0xθ0else
E[Y(n)]=0θxnθ(xθ)n1dx=0θn(xθ)ndx=nn+1θ

編集:確かに(コメントの議論を参照)MLEは、下限と上限両方が不明である場合の平均に偏っていない。次に、最小はのMLEで、(詳細は省略)期待値 一方 のMLE は 期待値 abY(1)a

E(Y(1))=na+bn+1
E(Y(n))=nb+an+1
(a+b)/2
Y(1)+Y(n)2
E(Y(1)+Y(n)2)=na+b+nb+a2(n+1)=a+b2

編集2:ヘンリーの点を詳しく説明するために、平均の推定量のMSEの小さなシミュレーションがあります.MLEは下限がゼロであることがわからない場合、2つのバリアントのMSEは同一であることを示しています、下限の知識を組み込んだ推定量が変動性を減らすことを示唆しています。

theta <- 1
mean <- theta/2
reps <- 500000
n <- 5
mse <- bias <- matrix(NA, nrow = reps, ncol = 2)

for (i in 1:reps){
  x <- runif(n, min = 0, max = theta)
  mle.knownlowerbound <- max(x)/2
  mle.unknownlowerbound <- (max(x)+min(x))/2
  mse[i,1] <- (mle.knownlowerbound-mean)^2
  mse[i,2] <- (mle.unknownlowerbound-mean)^2
  bias[i,1] <- mle.knownlowerbound-mean
  bias[i,2] <- mle.unknownlowerbound-mean

}

> colMeans(mse)
[1] 0.01194837 0.01194413

> colMeans(bias)
[1] -0.083464968 -0.000121968

ウィキペディアは別のモデルを最初から提案しているためです。そこに私の混乱があります。
カグダスオズゲンク16

はい。ただし、ここで説明した特別なケース、つまりに調整すると、1に戻ります。その場合、下限がゼロであることがわかっているため、推定にサンプルの最小値はもう必要ありません。そのため、中点のMLE(=中央値=平均)は、再びなります。a=0(max+0)/2
クリストフハンク

2
詳細は把握していませんが、最小値が下限値を最大値と同じ量だけ過大評価する場合、そのモデルのMLEは不偏になる可能性があるため、中点はバイアスなしで推定されます。
クリストフハンク

4
@CagdasOzgenc:不偏性はないだけかのも、最も重要な尺度であるより良いです。正確支援の一端を知ることによって、あなたは平均値を推定する際のエラーの間のバランスを失う可能性がありますが、範囲のより良い推定(例えば)で終わる
ヘンリー・

6
最尤推定量は、小さなサンプルサイズのすべての基準で常に「最良」とは限りません。だから何?彼らはふりもしません。実際のサンプルサイズの近傍にあるサンプルサイズのいくつかの基準に従って、より良い特性を持つ別の推定器を問題に使用する場合は、自由に使用できます。私はそうし、他の人もそうします。MLEであるという理由だけで、あらゆる状況でMLEの使用が正当化されると主張する人はいません。
jbowman 16

5

ここで、OPが参照するmath.seでの私の回答の省略を完了し、

Half Normal分布に 従うランダム変数のサイズ iidサンプルがあると仮定します。この分布の密度とモーメントはn

fH(x)=2/π1v1/2exp{x22v}E(X)=2/πv1/2μ,Var(X)=(12π)v

サンプルの対数尤度は

L(vx)=nln2/πn2lnv12vi=1nxi2

に関する一次導関数 はv

vL(vx)=n2v+12v2i=1nxi2,v^MLE=1ni=1nxi2

モーメント推定の方法です。なぜなら、

E(v^MLE)=E(X2)=Var(X)+[E(X)])2=(12π)v+2πv=v

しかし平均の結果の推定量は、ジェンセンの不等式により下方に偏っています

μ^MLE=2/πv^MLEE(μ^MLE)=2/πE(v^MLE)<2/π[E(v^MLE)]=2/πv=μ

4

有名なネイマン・スコット問題には、正しいものに収束することさえないという点で、一貫性のないMLEがあります。条件付き尤度の使用を動機付けます。

取ります。のMLE はで、のMLE はで期待値であるため、2倍にバイアスされています。(Xi,Yi)N(μi,σ2)μi(Xi+Yi)/2σ2σ^2=i=1n1nsi2si2=(Xiμ^i)2/2+(Yiμ^i)2/2=(XiYi)2/4σ2/4


2
この例は当てはまりますが、これは実際にはMLEの漸近結果の基本的な規則性条件の1つに反します。つまり、。ここで、は推定パラメーター数、はサンプルサイズです。k/n0kn
クリフAB

1
@CliffABの仮定違反は、パラメトリックディメンションが固定されていないことです。の次元は、に行きます。それはあなたが言っていることだと思うが、が何を意味するのか分からない。もちろん、この例の実際的な例は、これらの結果は小さなサンプルでも偏って​​おり、この場合を推定するには、混合効果モデルのような条件付き尤度を使用する必要があるということです。Θnkσ
AdamO 16

3

この現象には無限の範囲の例があります。

  1. 全単射の最尤推定量変換 Aパラメータの全単射は、最尤推定量の変換された、。θ θ Ψ θ MLEΨ(θ)θθΨ(θ^MLE)
  2. 最尤推定量、、の全単射変換の期待値は最尤推定量の期待値の全単射変換ではありません。Ψ θ MLEE [ Ψ θ MLE] Ψ E [ θ MLE ] θΨ(θ^MLE)E[Ψ(θ^MLE)]Ψ(E[θ^MLE])
  3. ほとんどの変換は、少なくともラプラス変換を適用できる場合、少なくとも指数族については、データの何らかの変換の期待値です。hX Ψ(θ)h(X)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.