わかりました。すばらしい@ Mur1loの回答のおかげで、私は理解が深まり、この抽象的な概念をできる限り具体的にするために私自身の試みをしたいと思います。
5つのコインの引き分け結果のサンプルがあるとします。これらは、真のパラメーターを持つベルヌーイ分布を持つ母集団からサンプリングされたと仮定π0。
結果とともに特定のコインの引き分けを見ると バツ3= 1、この患者がベルヌーイ分布からサンプリングされたすべての種類のパラメーター値を使用して、対数尤度を計算できます。π= 0.2 または π= 0.9等々。したがって、対数尤度は、バツ3 可能な各値について π。
L L (π|バツ3)=バツ3l n (π)+ (1 −バツ3)L nは(1 - π)
これは単に バツ3= 1 その可能性は π それが0の場合、その可能性は 1 - π。
コインドロー間の独立性を仮定すると、n = 5のコインドローのサンプル全体の対数尤度を表す「平均」関数が得られます。
L L (π| バツ)= ∑バツ私l n (π)+ (n − ∑ (バツ私))L N (1 - π)
の最大値を見つけたい L L (π| バツ)- MLE =πmle。
スコア関数 u(π)対数尤度の各パラメーターに関する導関数のベクトルです。幸いなことに、私たちの場合、パラメータは1つしかないため、これは単純なスカラーです。いくつかの条件の下で、それは私たちが見つけるのに役立ちますπmle、その時点でスコア関数は u(πmle)=0。単一の観測(コインドロー)の観測スコア関数を計算できます。
u(π|x3)=x3π−1−x31−π
n = 5の患者のサンプルスコア関数:
u(π|X)=∑xiπ−n−∑xi1−π
この最新の関数を0に設定すると、 πmle。
ただし、特定の5抽選サンプルは、スコア関数の期待とは関係ありません。期待値は、xのすべての可能な値に対する観測スコア関数の値に、その値の確率である密度関数を掛けたものです。私たちの場合、xは0と1の2つの値のみを取ることができます。そして密度関数は、パラメーターを持つベルヌーイであると想定したとおりです。π0:
E(u(π|xi))=∑x(xπ−1−x1−π)πx0(1−π0)1−x=π0π−1−π01−π
真のパラメータで評価するとゼロになることは明らかです π0。直感的な解釈は次のとおりです。π、尤度の平均変化率はどれくらいですか?
情報行列は、どのように敏感な私たちのソリューションは、さまざまなデータになります-可能性の分散をですか?(この回答を参照してください)。
I(π|xi)=var(u(π|xi))=var(xiπ−1−xi1−π)=var(xi−ππ(1−π))=var(xi)π2(1−π)2=π0(1−π0)π2(1−π)2
真のパラメータで評価されたとき π0 次のように簡素化されます。
私(π0|バツ私)=1π0(1 −π0)
(詳細については、ワシントンeduのノートを参照してください)。
驚くべきことに、特定の可能性がどれほど敏感であるかを測定する別の方法があります π!これは、曲率の期待値=ヘッセ行列= 2次導関数です。可能性が急であればあるほど、より正確になります。マーク・リードのブログで詳細をご覧ください