ましょう iid確率変数列の実現であると推定される観測データも共通確率密度関数とシグマ有限対策に関して定義。密度は、データ生成プロセス(DGP)密度と呼ばれます。y1,…,ynY1,…,Ynpeνpe
研究者の確率モデルでは、
は、パラメータベクトルインデックス付けされた確率密度関数のコレクションです
。各密度は、共通のシグマ有限測度に関して定義されていると仮定します(たとえば、各密度は同じサンプル空間確率質量関数である可能性があります)。M≡{p(y;θ):θ∈Θ}θMνS
データを実際に生成した密度を、データの確率モデルとは概念的に区別することが重要です。従来の統計処理では、これらの概念の慎重な分離は無視されるか、行われないか、確率モデルが正しく指定されていると最初から想定されています。pe
に関して正しく指定されたモデルは、ほぼどこでもモデルとして定義されます。場合
に関してmisspecifiedさ確率モデルが正しく指定されていない場合には、この対応します。Mpepe∈M νMpe
確率モデルが正しく指定されている場合は、そこに存在するAパラメータ空間におけるよう
-almostどこでも。このようなパラメータベクトルは、「真のパラメータベクトル」と呼ばれます。確率モデルの指定が間違っている場合、真のパラメーターベクトルは存在しません。θ∗Θpe(y)=p(y;θ∗) ν
Whiteのモデルの誤仕様フレームワーク内での目標は、を最小化
するパラメーター推定を見つけることいくつかのコンパクトパラメータ空間上。ユニークな厳密グローバル最小化、と仮定される、期待値のに内部に配置されている。確率モデルが正しく指定されている幸運な場合、は「真のパラメーター値」として解釈される場合があります。θ^n ℓ N(θ)≡(1/N)Σ N iが= 1つのログPを(YI、θ)Θθ * ℓ NΘΘθ*ℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^nΘΘθ∗
確率モデルが正しく指定されている特殊なケースでは、はおなじみの最尤推定値です。確率モデルが正しく指定されているという絶対的な知識がない場合、は準最尤推定値と呼ばれ、目標はを推定することです。幸運になり、確率モデルが正しく指定されると、準最尤推定値は特別な場合としておなじみの最尤推定値に減少し、
が真のパラメーター値になります。θ^n θ nはθ*θ*θ^nθ∗θ∗
White(1982)フレームワーク内の一貫性は、が必ずしも真のパラメーターベクトルである必要はなく、への収束に対応します。Whiteのフレームワーク内では、δによって生成されたセットがTRUE分布P *を含むイベントの確率を推定することはありません。代わりに、δによって生成されたセットが密度指定された分布を含むイベントの確率である確率分布P **を常に推定し
ます。θ∗θ∗p(y;θ∗)
最後に、モデルの仕様ミスに関するいくつかのコメント。誤って指定されたモデルが非常に有用で、非常に予測的である例を見つけるのは簡単です。たとえば、分散が非常に小さいが、環境内の実際の残留誤差がガウスではないガウス残留誤差項を持つ非線形(または線形)回帰モデルを考えます。
また、正しく指定されたモデルが役に立たず、予測的でない例も簡単に見つかります。たとえば、明日の終値が今日の終値と非常に大きな分散をもつガウスノイズの加重和であると予測する株価を予測するためのランダムウォークモデルを考えてみましょう。
モデルの誤仕様フレームワークの目的は、モデルの有効性を確保することではなく、信頼性を確保することです。つまり、パラメーターの推定、信頼区間、仮説検定などに関連するサンプリング誤差が、モデルの仕様の少量または大量の存在にもかかわらず正しく推定されることを確認します。準最尤推定値は、負の対数尤度関数の1次導関数と2次導関数の両方に依存する共分散行列推定器を使用して、を中心とする漸近的に正規です。幸運に恵まれ、モデルが正しい特別な場合、すべての式は、目標が「真の」パラメーター値を推定することであるおなじみの古典的な統計的枠組みに還元されます。θ∗