他の答えを補完しようとしています...フィッシャー情報とはどのような情報ですか?ログ尤度関数と開始
の関数としてのθのためのθ ∈ Θ、パラメータ空間。私たちがここで議論していないいくつかの規則性の条件を仮定すると、我々は持っている
Eを∂
ℓ (θ )= logf(x ; θ )
θθ ∈ Θ(ここではのようにドットとしてパラメータに対する導関数を記述します)。分散は、フィッシャー情報である
I(θ)=Eθ( ˙ ℓ(θ))2=-Eθ ¨ ℓ(θ)
がログ尤度関数の(負の)曲率であることを示す最後の式。多くの場合、次の最尤推定量(mle)が見つかります。
E∂∂θℓ (θ )= Eθℓ˙(θ )= 0私(θ )= Eθ(ℓ˙(θ ))2= − Eθℓ¨(θ )
尤度方程式を解くことによって
˙ ℓ(θ )= 0スコアの分散としてフィッシャー情報
˙ ℓ(θが)大きいが、その方程式の解は、データに対して非常に敏感であること高いへの希望を与えるであろうmleの精度。それは少なくとも漸近的に確認され、mleの漸近分散はフィッシャー情報の逆数です。
θℓ˙(θ )= 0ℓ˙(θ )
これをどのように解釈できますか? は、サンプルのパラメーターθに関する尤度情報です。これは、実際には、我々は、尤度比検定を介して2つの別個の可能なパラメータ値のplausibilitiesを比較するためにそれを使用するときのように、相対的な意味で解釈することができるℓ (θ 0)- ℓ (θ 1)。対数尤度の変化率は、スコア関数である˙ ℓ(θ )私たちどれだけ速く可能性の変化を伝え、そしてその分散I (θ )ℓ (θ )θℓ (θ0)- ℓ (θ1)ℓ˙(θ )私(θ )サンプルからのサンプルに、与えられたparamiter値で、どのくらいこのばらつくことを言う。(!本当に驚くべきものである)式
I (θ )= - E θ ¨ ℓ(θは)
与えられたパラメータ値、情報の変動との間にrelationsship(平等)(可能性)があるを教えてくれるθ 0は、とそのパラメーター値の尤度関数の曲率。これは、THS統計のばらつき(分散)との意外な関係である˙ ℓ(θ )| θ = θ 0θ0
私(θ )= − Eθℓ¨(θ )
θ0ℓ˙(θ )∣θ = θ0そして尤度の予想される変更は、我々は、パラメータ変わるとき
一部区間の周りで
θ 0(同じデータ用)を。これは本当に奇妙で、驚くほど強力です!
θθ0
それでは、尤度関数とは何ですか?我々は通常、統計モデルを考えるデータの確率分布のファミリーとしてXパラメータによって索引付け、θパラメータ空間内のいくつかの要素Θ。我々はいくつかの値が存在する場合は、trueであるとして、このモデルを考えるθ 0 ∈ Θようなデータがあることxが実際に持っている確率分布F (X ; θ 0){ f(X ; θ )、θ ∈ Θ }バツθΘθ0∈ Θバツf(x ; θ0)。我々は真のdatagenerating確率分布埋め込むことにより、統計モデルを得るように、確率分布の家族の中に。しかし、そのような埋め込みは多くの異なる方法で実行でき、そのような埋め込みはそれぞれ「真の」モデルになり、異なる尤度関数を与えることは明らかです。そして、そのような埋め込みがなければ、尤度関数はありません。埋め込みを賢明に選択するためのいくつかの原則、いくつかの原則が本当に必要なようです!f(x ; θ0)
それで、これはどういう意味ですか?つまり、尤度関数の選択により、真実が少し変わった場合にデータがどのように変化するかがわかります。データは唯一の真のモデル関数についての情報与えないようしかし、これは本当に、データによって検証することができません選びだし、モデル内の他のすべての要素については何も実際にデータを生成し、そしてません。このように、尤度関数の選択は、ベイジアン分析の事前の選択に似ており、非データ情報を分析に注入します。私たちは、単純な(やや人工)の例ではこれを見て、埋め込むの効果を見てみましょうF (Xは、θ 0)f(x ; θ0)f(x ; θ0) モデルのさまざまな方法で。
私たちがいると仮定しましょうとしてIIDされているN (μ = 10 、σ 2 = 1 )。したがって、これが真のデータ生成ディストリビューションです。今、私たちは、2つの異なる方法、モデルAとモデルBのモデルでこれを埋め込むせて
A :X 1、... 、X nが IID Nを(μ 、σ 2 = 1 )、μ ∈ Rバツ1、… 、XnN(μ = 10 、σ2= 1 )
これが μ = 10で一致することを確認できます。
A :X1、… 、Xn iid N (μ 、σ2= 1 )、μ ∈ RB :X1、… 、Xn iid N (μ 、μ / 10 )、μ > 0
μ = 10
ログ尤度関数は、となる
ℓA(μ )= − n2ログ(2 π)− 12∑私(x私- μ )2ℓB(μ )= − n2ログ(2 π)− n2ログ(μ / 10 )− 102∑私(x私- μ )2μ
スコア機能(ログ尤度誘導体):
及び曲率
¨ ℓの A(μ)=-N
ℓ˙A(μ )= n (x¯- μ )ℓ˙B(μ )= − n2 μ− 102∑私(x私μ)2− 15 n
そう、フィッシャー情報は、実際に埋め込むに依存します。ここで、真の値
μ=10、
IA(μ=10)=nでフィッシャー情報を計算します
。ℓ¨A(μ )= − nℓ¨B(μ )= n2 μ2+ 102∑私2 x2私μ3
μ = 10
したがって、パラメーターに関するフィッシャー情報は、モデルBでいくらか大きくなります。
私A(μ = 10 )= n 、私B(μ = 10 )= N ⋅ (1200+ 20202000年)> n
μ
また、この例は、モデルファミリの構築方法を支援するための理論が本当に必要であることを示しています。