RV FoutzとRC Srivastavaはこの問題を詳細に調査しました。彼らの1977年論文「尤度比検定のパフォーマンスモデルが間違っています」彼らの1978年論文ながら、証拠の非常に簡単なスケッチと一緒にmisspecificationの場合の分布結果の声明が含まれている「尤度比の漸近分布モデルが間違っています」という証明が含まれていますが、後者は昔ながらのタイプライターで入力されています(ただし、両方の論文で同じ表記法が使用されているため、それらを組み合わせて読むことができます)。また、証明のいくつかのステップについて、彼らはKPロイの論文「1からの尤度比の漸近分布に関するノート」を参照しています。
分布の誤仕様の場合、MLEがまだ一貫しており、漸近的に正常である場合(常にそうとは限りません)、LR統計量は、独立したカイ2乗(それぞれ1自由度)の線形結合に従います。
−2lnλ→d∑i=1rciχ2i
ここで、です。「類似性」を見ることができます。h - mの自由度を持つ1つのカイ2乗の代わりに、それぞれ1つの自由度を持つh - mのカイ2乗があります。しかし、カイ二乗の線形結合は閉形式密度を持たないため、「アナロジー」はそこで終わります。スケーリングされた各カイ2乗はガンマですが、ガンマの異なるスケールパラメーターをもたらす異なるc iパラメーターを持ち、そのようなガンマの合計は閉形式ではありませんが、その値は計算できます。r=h−mh−mh−mci
以下のために定数、我々は持っているC 1 ≥ C 2 ≥ 。。。C R ≥ 0、彼らは行列...行列の固有値はありますか?著者の表記法を使用して、Λを対数尤度のヘッセ行列に、Cを対数尤度の勾配の外積(期待値で)に設定します。そうV = Λ - 1 C (Λ ' )- 1は、 MLEの漸近分散共分散行列です。cic1≥c2≥...cr≥0ΛCV=Λ−1C(Λ′)−1
次に、をVのr × r上対角ブロックに設定します。 Mr×rV
また、をブロック形式で記述しますΛ
Λ=[Λr×rΛ2Λ′2Λ3]
セット(Wのシューア補数の負ですΛ)。W=−Λr×r+Λ′2Λ−13Λ2WΛ
次に、は、パラメーターの真の値で評価された行列M Wの固有値です。ciMW
補遺
コメント中のOPの有効な発言への応答(実際、質問はより一般的な結果を共有するための踏み台になり、プロセスで無視される場合があります)。ここで、ウィルクスの証明は次のように進みます。 MLEの正規分布、および尤度比の関数式の導出に進みます。彼のeqまで。、分布の仕様が間違っていると仮定しても、証明は前進できます。OPが示すように、分散共分散行列の条件は仕様の誤りのシナリオでは異なりますが、ウィルクスはすべて微分を行い、漸近的に無視できる用語。そして、彼はeqに到着します。[ 9 ][9][9]h−mh−m
−2lnλ=∑i=1h−m(n−−√θ^i−θiσi)2→dχ2h−m
But if we have misspecification, then the terms that are used in order to scale the centered and magnified MLE n−−√(θ^−θ) are no longer the terms that will make the variances of each element equal to unity, and so transform each term into a standard normal r.v and the sum into a chi-square.
And they are not, because these terms involve the expected values of the second derivatives of the log-likelihood... but the expected value can only be taken with respect to the true distribution, since the MLE is a function of the data and the data follows the true distribution, while the second derivatives of the log-likelihood are calculated based on the wrong density assumption.
So under misspecification we have something like
−2lnλ=∑i=1h−m(n−−√θ^i−θiai)2
and the best we can do is to manipulate it into
−2lnλ=∑i=1h−mσ2ia2i(n−−√θ^i−θiσi)2=∑i=1h−mσ2ia2iχ21
which is a sum of scaled chi-square r.v.'s, no longer distributed as one chi-square r.v. with h−m degrees of freedom. The reference provided by the OP is indeed a very clear exposition of this more general case that includes Wilks' result as a special case.