フィッシャーのスコア関数は平均ゼロを持っています-それはどういう意味ですか?


8

尤度理論のプリンストンのレビューに従っています。彼らFisher’s score functionは、対数尤度関数の1次導関数として定義し、スコアはランダムなベクトルであると言います。例:幾何分布:

あなたπ=1πy¯1π

そして、それは確かに(パラメータ)関数であり、含むためランダムです。πy¯

しかし、彼らは私が理解していないことを言います:「真のパラメーター値評価されたスコアは平均ゼロです」と彼らはそれをとして公式化し。「真のパラメータ値」で評価して、その平均を見つけるとはどういう意味ですか?そして、幾何学的な例では、アイデンティティすると、すぐに?「真のパラメータ値」はこれとどのように関係していますか?πEあなたπ=0Ey=Ey¯=1ππEあなたπ=0


回答:


8

スコア関数を指摘したように あなた は、適切な規則性条件下で、「対数尤度関数の1次導関数」として定義されます。

としましょう バツ 密度関数を持つ確率変数です fバツ。通常、この密度はパラメーターのベクトルに応じて変化しますπ。したがって、密度関数を次のように書くと便利です。fバツ;πパラメータへの依存関係を明示的にします。の「真の」値がπ 確率変数 バツ です π=π0。(つまり、バツf;π0

スコア関数は次のように書くことができます:

あなたπ;バツ=πログfバツ;π
そして、それは両方の機能であることは明らかです バツ との π。(あなたの質問ではL 代わりに f、しかし尤度関数は密度関数に過ぎないため、違いはありません。)

今確率変数を考えてください あなたπバツ そしてその期待 ξπ=Eπ0あなたπバツ。ここで、下付き文字に注意することが重要ですπ0 の分布の(真の)パラメータを示すためにあります バツ そしてそれを価値から区別する π 計算に使用している あなた

仮定して f 連続密度です(離散ケースも同様です)。

ξπ=+πログfバツ;πfバツ;π0dバツ=+fバツ;πfバツ;πfバツ;π0dバツ

そしてあなたが評価するとき ξ 真のパラメータ値 π0 我々が得る:

ξπ0=+fバツ;π0fバツ;π0fバツ;π0dバツ=+fバツ;π0dバツ
=π+fバツ;π0dバツ=0

これが、真のパラメーターで期待値がゼロであるスコア関数の背後にある理由です。

このような(第3章)を見て、それらの派生(微分と積分の交換など)が成立する条件をより深く理解する必要があります。


ありがとう!しかし、まだ別の値をプラグインするとなぜそれが0にならないのかわかりませんπ1?積分wrtを切り替える同じトリックを使用することはできませんかバツ と派生wrt π
ihadanny

1
ξπ1=fバツ;π1fバツ;π1fバツ;π0dバツ そして今、私たちは分母をキャンセルすることができません π1π0
Mur1lo

別の質問-あなたの答えでは、単一の観測のスコア関数またはn個の観測のサンプル全体のスコア関数を意味しましたか?
ihadanny

@ihadannyサンプルはランダム変数の単一の実現として見ることができるため、違いはありません R
Mur1lo 2016

これは、この問題について私が見た中で最も明確な証拠です。ありがとうございました!:)
jjepsuomi 2018年

4

わかりました。すばらしい@ Mur1loの回答のおかげで、私は理解が深まり、この抽象的な概念をできる限り具体的にするために私自身の試みをしたいと思います。

5つのコインの引き分け結果のサンプルがあるとします。これらは、真のパラメーターを持つベルヌーイ分布を持つ母集団からサンプリングされたと仮定π0

結果とともに特定のコインの引き分けを見ると バツ=1、この患者がベルヌーイ分布からサンプリングされたすべての種類のパラメーター値を使用して、対数尤度を計算できます。π=0.2 または π=0.9等々。したがって、対数尤度は、バツ 可能な各値について π

LLπ|バツ=バツlπ+1バツl1π

これは単に バツ=1 その可能性は π それが0の場合、その可能性は 1π

コインドロー間の独立性を仮定すると、n = 5のコインドローのサンプル全体の対数尤度を表す「平均」関数が得られます。

LLπ|バツ=Σバツlπ+Σバツl1π

の最大値を見つけたい LLπ|バツ- MLE =πmle

スコア関数 u(π)対数尤度の各パラメーターに関する導関数のベクトルです。幸いなことに、私たちの場合、パラメータは1つしかないため、これは単純なスカラーです。いくつかの条件の下で、それは私たちが見つけるのに役立ちますπmle、その時点でスコア関数は u(πmle)=0。単一の観測(コインドロー)の観測スコア関数を計算できます。

u(π|x3)=x3π1x31π

n = 5の患者のサンプルスコア関数

u(π|X)=xiπnxi1π

この最新の関数を0に設定すると、 πmle


ただし、特定の5抽選サンプルは、スコア関数の期待とは関係ありません。期待値は、xのすべての可能な値に対する観測スコア関数の値に、その値の確率である密度関数を掛けたものです。私たちの場合、xは0と1の2つの値のみを取ることができます。そして密度関数は、パラメーターを持つベルヌーイであると想定したとおりです。π0

E(u(π|xi))=x(xπ1x1π)π0x(1π0)1x=π0π1π01π

真のパラメータで評価するとゼロになることは明らかです π0。直感的な解釈は次のとおりです。π、尤度の平均変化率はどれくらいですか?


情報行列は、どのように敏感な私たちのソリューションは、さまざまなデータになります-可能性の分散をですか?(この回答を参照してください)。

I(π|xi)=var(u(π|xi))=var(xiπ1xi1π)=var(xiππ(1π))=var(バツπ21π2=π01π0π21π2

真のパラメータで評価されたとき π0 次のように簡素化されます。

π0|バツ=1π01π0

(詳細については、ワシントンeduのノートを参照してください)。

驚くべきことに、特定の可能性がどれほど敏感であるかを測定する別の方法があります π!これは、曲率の期待値=ヘッセ行列= 2次導関数です。可能性が急であればあるほど、より正確になります。マーク・リードのブログで詳細をご覧ください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.