GLMでは、飽和モデルの対数尤度は常にゼロですか?


14

一般化線形モデルの出力の一部として、ヌルと残差偏差を使用してモデルを評価します。飽和モデルの対数尤度で表されるこれらの量の式をよく見ます。たとえば、https//stats.stackexchange.com/a/113022/22199ロジスティック回帰:飽和モデルを取得する方法

私が理解する限り、飽和モデルは観測された応答に完全に適合するモデルです。したがって、私が見たほとんどの場所で、飽和モデルの対数尤度は常にゼロとして与えられます。

しかし、逸脱の公式が与えられる方法は、この量がゼロでない場合があることを示唆しています。(常にゼロであるかのように、なぜそれを含めるのが面倒ですか?)

どのような場合にゼロ以外になる可能性がありますか?決してゼロ以外ではない場合、なぜ逸脱の式に含めるのですか?

回答:


18

対数尤度を本当に意味する場合、答えは次のとおりです。常にゼロではありません。

例えば、ポアソンデータを考慮してください。以下のための対数尤度Y = Y 1... Y nが:で与えられる μ ; Y = - N Σは iが= 1 μ I + N Σ iは= 1、I N Σの Iyポアソンμ=1nY=y1yn

()(μ;Y)=i=1nμi+i=1nyilogμii=1nlog(yi!).

分化* に対してμ Iおよびに設定0(これは、我々は、飽和モデルのMLEを得る方法である): - 1 + Y I(μ;Y)()μi0 ため、この解決μiを得るために、μ iは=YIを置換する、 μ Iに戻し*のためにμiは飽和モデルの対数尤度であることを与える: μ ;Y=n i=1yilogyi1n

1+yiμi=0.
μiμ^i=yμ^()μiyiが非常に特別な値をとら ない限り、 1 logyi0
(μ^;Y)=i=1nyi(logyi1)i=1nlog(yi!)0
yi

R関数のヘルプページのglmitemの下devianceで、ドキュメントはこの問題を次のように説明しています。

deviance 最大の対数尤度のマイナス2倍の定数まで。合理的な場合、定数は飽和モデルが逸脱ゼロを持つように選択されます。

飽和モデルの対数尤度ではなく、逸脱がゼロになるように選択されていることに注意してください。

おそらく、あなたが本当に確認したかったのは、「逸脱飽和モデルのは常にゼロとして与えられる」ことであり、これは定義から逸脱しているので真実ですアランによるカテゴリデータ分析(第2版)のセクション4.5.1を参照 Agresti)は、飽和モデルに対する指定されたGLMの尤度比統計です。constantRドキュメントの前述のは、実際には、飽和モデルの二倍最大化対数尤度です。

「まだ、逸脱の公式が与えられる方法は、この量がゼロでない場合があることを示唆しています。」という文については、おそらく逸脱という用語の使用の乱用によるものです。たとえば、Rでは、2つの任意の(ネストされた)モデルM1、より正確と呼ばれるであろう乖離度と呼ばれ、のずれの間の M 1との乖離M2M1M2、Agrestiの本にある定義に厳密に従った場合。

結論

  1. 飽和モデルの対数尤度は一般にゼロではありません。

  2. 飽和モデルの偏差(元の定義では)はゼロです。

  3. ソフトウェア(Rなど)からの逸脱出力は、実際には他の何か(逸脱の違い)を意味するため、一般にゼロではありません。


7

(1)f(yi;θi,φ)=exp[Ai(yiθiγ(θi))/φ+τ(yi,φ/Ai)].
Aiφ
(θ,φ;Y)=i=1nAi(yiθiγ(θi))/φ+i=1nτ(yi,φ/Ai).
0=U(θi)=(θ,φ;Y)θi=Ai(yiγ(θi))φ

θ^i

()(θ^,φ;Y)=i=1nAi(yiθ^iγ(θ^i))/φ+i=1nτ(yi,φ/Ai).

私の以前の答えでは、右側の最初の項()は常にゼロである、上記のポアソンデータの例はそれが間違っていることを証明しています。より複雑な例として、ガンマ分布考えますΓ(α,β)は、付録に記載されて考慮してください。


f(y;α,β)=βαΓ(α)eβyyα1,y>0,α>0,β>0,
f(1)
φ=1α,θ=βα,
f
f(y;θ,φ)=exp[θy(log(θ))φ+τ(y,φ)],
τ(y,φ)=logφφ+(1φ1)logylogΓ(φ1).
θ^i=1yi
i=1n1φ[θ^iyi(log(θ^i))]=i=1n1φ[1log(yi)]0,
yi

1
モデルが可能な結果のそれぞれに100%の確率を割り当てることができる場合にのみ、対数尤度はゼロですか?
アレックス

0τ0

あなたの派生は非常に良いですが、正式な証拠は現時点で私の頭の上に少しあります。ポアソンモデルの例に感謝します。この例から取り出したのは、ポアソンモデルがポアソン平均の値が与えられた場合、観測された結果に100%の確率を割り当てることができないため、尤度をゼロにすることはできません。
アレックス

100%y1,,ynYP(Y=y1)+P(Y=y2)++P(Y=yn)<1

1
YP(Y=yi)<1i

4

0

(1)Ly;バツβ==1nfy;バツβ==1nπy1π1y==1nπ1πy1π
π=invlogitバツβ

logL(y;X,β)=i=1nyilog(πi1πi)+log(1πi)=i=1nyilogit(πi)+log(1πi)=i=1nyixiβ+log(1invlogit(xiβ))=i=1nyixiβ+log(invlogit(xiβ))=i=1nyixiβlog(1+exp[xiβ]))

If you take the derivatives with respect to all of the coefficients you get

(2)(β)=i=1nyixiexp[xiβ](1+exp[xiβ])xi.

Setting this expression equal to 0 and solving for β will give you your answer. Usually this can't be done analytically, which explains the popularity/necessity of using iterative algorithms to fit this model, but in the case of a saturated model, it is possible.

To find the saturated model, we give each row it's own coefficent. So βRn and the design matrix times the coefficient vector is

Xβ=[100010001][β1β2βn].

Note that in particular, xiβ=βi.

So taking the jth row of equation (2) gives us

i=1nyixi,j=i=1nexp[xiβ](1+exp[xiβ])xi,j

which can only be true if for each observation i:

yi=invlogit(βi)
or in other words each βi is plus or minus infinity (if yi is 1 or 0, respectively). We can plug these parameters back into (1) to get the maximized likelihood:
i=1nπ^iyi(1π^i)1yi=1n=1.
Clearly the log of this is 0.


But this assumes ungrouped data. If you have groups with ni>1 (and the same covariate values) (in R, forexample using the form glm( cbind(k, n-k) ~ x + ... ) then the saturated model do not have loglikelihood zero.
kjetil b halvorsen

@kjetilbhalvorsen oh good point. I never tried that let me check
Taylor

1

@Alex:はい、そうです。少なくとも離散分布の場合。連続分布の場合、密度を1に等しくすることになりますが、これは必ずしも意味がなく、したがって、試行して達成するのが賢明なことではありません。少し一般的には、飽和モデルの対数尤度は、基礎となる分布ファミリーの仮定に従うモデルのパフォーマンスの上限を提供します。言い換えれば、飽和二項モデルの対数尤度は、Yが二項であると仮定して、与えられたデータセット(X、Y)に対して「得る限り良好」です。モデルは応答分布の仮定によって本質的に制約されるため、glmモデルを、たとえば100%(または同様)とは対照的に、この上限と比較することは理にかなっています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.