観測されたフィッシャー情報が正確に使用されるのはなぜですか?


17

標準最尤設定(iidサンプル密度)の分布からの)および指定されたモデルの場合、フィッシャー情報は F YY | θ 0をY1,,Ynfy(y|θ0

I(θ)=Eθ0[2θ2lnfy(θ)]

ここでは、データを生成した真の密度に関して予測が行われます。観察されたフィッシャー情報を読んだ

J^(θ)=2θ2lnfy(θ)

(予想される)フィッシャー情報の計算に含まれる積分が場合によっては実行できない可能性があるため、私を混乱させているのは、積分が実行可能であっても、未知のパラメーター値が関係している真のモデルに関して期待をしなければならないことです。その場合は、を知らないを計算することは不可能です。これは本当ですか? θ 0 Iθ0θ0I

回答:


13

trueパラメータ:あなたはここに4 quanties持っ、一貫性の推定θ、期待される情報I θ θと観測情報J θ θを。これらの数量は漸近的にのみ同等ですが、通常はそれらの使用方法です。θ0θ^I(θ)θJ(θ)θ

  1. 観測情報 予想情報に確率に収束 Iθ0=Eは、θ0[2

    J(θ0)=1Ni=1N2θ02lnf(yi|θ0)
    場合YはからIID試料である Fθ0。ここでEθ0Xを示し期待W / R / Tによって指標付け分布θ0XFX|θ0、D、X。この収束は理由大数の法則を保持しているので、その仮定YF
    I(θ0)=Eθ0[2θ02lnf(y|θ0)]
    Yf(θ0)Eθ0(x)θ0xf(x|θ0)dx、ここで非常に重要です。Yf(θ0)
  2. あなたは推定持っている場合はθを真のパラメータに確率が収束することをθ 0(すなわち、一貫性のある)、あなたはあなたが見るどこでものためにそれを置き換えることができθ 0を、本質的に起因する連続写像定理に、上記の*、およびすべての収束の保持が継続します。θ^θ0θ0

実際には、少し微妙に見えます。

リマーク

推測したように、通常、微分は統合よりも簡単であるため、観察された情報は扱いやすく、数値最適化の過程ですでに評価されている可能性があります。状況によっては(正規分布)同じになります。

Efron and Hinkley(1978)の記事「最尤推定量の精度の評価:観測されたフィッシャー情報と観測されたフィッシャー情報」は、有限サンプルの観測情報を支持して議論を展開しています。


4

Efron&Hinkleyの理論的観察(Andrewの答えで言及されている)を支持するように見えるいくつかのシミュレーション研究がありました。正しいモデル形式が不明な場合のモデルベースの信頼区間のパフォーマンスの比較。疫学、5、171-182。矛盾する研究を見たことはありません。興味深いのは、私が知っている標準のGLMパッケージがWald間隔を計算するために予想される情報を使用していることです。もちろん、これは、(自然パラメーターのGLMのように)観測された情報マトリックスと期待された情報マトリックスが等しい場合には問題になりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.