指数ファミリ:観察された統計と期待される十分な統計


10

私の質問は、ランダムベクトルの観測に基づいてディリクレ分布の最尤推定量を導出するという文脈で、証明なしに次のように述べているMinkaの「ディリクレ分布の推定」を読んでいることから生じます。

指数関数ファミリーの場合と同様に、勾配がゼロの場合、予想される十分な統計は、観測された十分な統計と等しくなります。

このように提示された指数関数の最尤推定を見たことがなく、検索で適切な説明も見つかりませんでした。誰かが観測された統計と予想される十分な統計との関係についての洞察を提供し、おそらくそれらの差を最小化することで最尤推定を理解するのを助けることができますか?

回答:


11

これは指数関数的ファミリーに関する通常の主張ですが、私の意見では、ほとんどの場合、経験の少ない読者を混乱させるような方法で述べられています。額面でとると、「ランダム変数が指数ファミリーの分布に従う場合、サンプルを取り、それを十分な統計に挿入すると、統計の真の期待値が得られます。」それだけだった場合は...さらに、サンプルのサイズが考慮されないため、さらに混乱が生じる可能性があります。

指数密度関数は

(1)fX(x)=h(x)eη(θ)T(x)eA(θ)

T(x)

SxX

(2)Sxh(x)eη(θ)T(x)eA(θ)dx=1

(2)θ

(3)θSxh(x)eη(θ)T(x)eA(θ)dx=(1)θ=0

差別化と統合の順序を入れ替えることで、

(4)Sxθ(h(x)eη(θ)T(x)eA(θ))dx=0

私たちが持っている差別化を実行する

(5)θ(h(x)eη(θ)T(x)eA(θ))=fX(x)[T(x)η(θ)A(θ)]

(5)(4)

SxfX(x)[T(x)η(θ)A(θ)]dx=0

(6)η(θ)E[T(X)]A(θ)=0E[T(X)]=A(θ)η(θ)

(6)θθT(X)θ0(6)

(6a)Eθ0[T(X)]=A(θ)η(θ)|θ=θ0

n

L(θx)=i=1nlnh(xi)+η(θ)i=1nT(xi)nA(θ)

θ0

(7)θ^(x):1ni=1nT(xi)=A(θ)η(θ)|θ=θ^(x)

(7)(6a)2 θθ^3,4,5,6θ^6aθ^

(6b)Eθ^(x)[T(X)]=A(θ)η(θ)|θ=θ^(x)

(7)

Eθ^(x)[T(X)]=1ni=1nT(xi)

θ^(x)θx

n=1


6aから6bへの移行が有効である理由を詳しく説明してください。
Theoden、

1
(2)(3)(2) θθ^3,4,5,6θ^

@AlecosPapadopoulos以下の証明は、あなたが最初に言うことを示唆しているようです-"ランダム変数が指数ファミリーの分布に従う場合、サンプルを取り、それを十分な統計に挿入すると、真の期待値が得られます統計の」は本当です。つまり、(2)については常にそれを実行し、観測された十分な統計に置き換えて結果を取得することができます。ここで何が欠けていますか?よくわかりません。
user10024395

6aθ6b

1
微分と積分の順序を式で交換できる理由を説明してください。(3)お願いします
Markus777 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.