切り捨てられた分布の最尤推定量


28

検討Nの独立した試料Sランダム変数から得られたX(例えばA切り捨て分布に従うと仮定される正規分布を切り捨て既知の(有限の)最小値と最大値の)およびBが、未知パラメータのμ及びσ 2。場合Xは非切り捨て分布に従って、最尤推定量は、μ及びσ 2のためのμ及びσ 2からSは試料の平均であろうμabμσ2Xμ^σ^2μσ2Sμ^=1NiSi及び試料分散 σ 2=1σ^2=1Ni(Siμ^)2。しかし、切り捨て分布のために、このように定義されたサンプル分散はで囲まれている(ba)2、それは必ずしも一致推定量ではないのでための:σ2>(ba)2、それに対して確率で収束することができませんσ2としてN無限大になります。そのようですので、 μ及び σ 2は、の最尤推定量ではありませんμμ^σ^2μそして、切り捨て配布するため。もちろん、これは以来、予想されるμσ 2つの切断正規分布のパラメータは、その平均と分散ではありません。σ2μσ2

それでは、既知の最小値と最大値の切り捨てられた分布のおよびσパラメーターの最尤推定量は何ですか?μσ


分析について確かですか?切り詰められた状況のために、のMLE:私はあなたが無効な仮定を作っていると思いませんもはや標本分散されていない(そして、一般的には、のMLE μはもはやサンプルの平均です)!σ2μ
whuber

whuber:私は知っている、これは私の質問は正確です:のMLEは何ですかおよびμ切り捨てられた場合には?これを主張する文を追加します。σ2μ
a3nm

1
閉じた形式のソリューションはありません。できることは、対数尤度を数値的に最小化することだけです。しかし、これは定性的には、他の多くのモデル(ロジスティック回帰など)と違いはありません。他のモデルも閉じた形式のソリューションを持ちません。
whuber

whuber:これが本当なら、これはかなりがっかりです。閉じた形式のソリューションの欠如についての参照はありますか?最尤ではないが、少なくとも一貫性のある(およびオプションで不偏の)閉形式の推定量はありますか?
a3nm

1
@whuber:最小化が高速になるように、少なくともサンプルを十分な統計に単純化できますか?
ニールG

回答:


29

「標準」分布Fによって決定されるロケーションスケールファミリを検討しますF

ΩF={F(μ,σ):xF(xμσ)σ>0}.

微分可能と仮定すると、PDFは1F1σf((xμ)/σ)dx

これらの配布を切り捨てabのサポートを制限するため、a < bは、PDFが次のように置き換えられることを意味します。aba<b

f(μ,σ;a,b)(x)=f(xμσ)dxσC(μ,σ,a,b),axb

他のすべての値ではゼロです)ここで、C μ σ a b = F μ σ b F μ σ a は、f μ σ ; a b は単一性に統合されます。(Cはまったく同じであることに注意してください1xC(μ,σ,a,b)=F(μ,σ)(b)F(μ,σ)(a)f(μ,σ;a,b)C1 in the absence of truncation.) The log likelihood for iid data xi therefore is

Λ(μ,σ)=i[logf(xiμσ)logσlogC(μ,σ,a,b)].

Critical points (including any global minima) are found where either σ=0 (a special case I will ignore here) or the gradient vanishes. Using subscripts to denote derivatives, we may formally compute the gradient and write the likelihood equations as

0=Λμ=i[fμ(xiμσ)f(xiμσ)Cμ(μ,σ,a,b)C(μ,σ,a,b)]0=Λσ=i[fσ(xiμσ)σ2f(xiμσ)1σCσ(μ,σ,a,b)C(μ,σ,a,b)]

Because a and b are fixed, drop them from the notation and write nCμ(μ,σ,a,b)/C(μ,σ,a,b) as A(μ,σ) and nCσ(μ,σ,a,b)/C(μ,σ,a,b) as B(μ,σ). (With no truncation, both functions would be identically zero.) Separating the terms involving the data from the rest gives

A(μ,σ)=ifμ(xiμσ)f(xiμσ)σ2B(μ,σ)nσ=ifσ(xiμσ)f(xiμσ)

By comparing these to the no-truncation situation it is evident that

  • Any sufficient statistics for the original problem are sufficient for the truncated problem (because the right hand sides have not changed).

  • Our ability to find closed-form solutions relies on the tractability of A and B. If these do not involve μ and σ in simple ways, we cannot hope to obtain closed-form solutions in general.

For the case of a normal family, C(μ,σ,a,b) of course is given by the cumulative normal PDF, which is a difference of error functions: there is no chance that a closed-form solution can be obtained in general. However, there are only two sufficient statistics (the sample mean and variance will do) and the CDF is as smooth as can be, so numerical solutions will be relatively easy to obtain.


Thanks a lot for this very detailed answer! I'm not sure I get what fμ, fσ , Cμ, and Cσ are, could you define them? Also, it's obvious but to be precise maybe you could say that your expression for the pdf is for x[a,b] (and the pdf is zero outside of that). Thanks again!
a3nm

1
The usual longer notation is Cμ=μC(μ,σ,a,b), etc: as announced, it is a derivative. I will make the second change you suggest because it's an important clarification, thanks.
whuber

Also, since your answer is more general than the one I expected, I edited my question to insist less on the case of normal distributions. Thanks again for your effort.
a3nm

1
It was easier to explain at this level of generality compared to focusing on the Normal distributions! Computing the derivatives and showing the precise form of the CDF are unnecessary distractions (although useful when you start actually coding the numerical solution).
whuber

1
Thanks for fixing! You missed one of them; could you review my edit?
a3nm
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.