一連の独立した同一分布の単変量観測と、生成方法に関する2つの仮説があるとします。
: は、平均と分散が不明な単一のガウス分布から描画されます。
: は、平均、分散、混合係数が不明な2つのガウス分布の混合物から描画されます。
私が正しく理解している場合、これらはネストされたモデルです表すモデルは、2つのガウスのパラメーターが同一になるように制約するか、2つのガウスの1つについて混合係数がゼロになるように制約する場合、記述できるためです。
したがって、EMアルゴリズムを使用してのパラメーターを推定し、ウィルクスの定理を使用してのデータの可能性がのデータの可能性よりも大幅に高いかどうかを判断できるように思われ。EMアルゴリズムがここで最大の可能性に収束するという仮定には多少の信頼がありますが、それは私が喜んで作成するものです。
モンテカルロシミュレーションでこれを試しましたは(2番目のガウス分布と混合パラメーターの平均と分散)よりも3自由度が高いと仮定しています。からのデータをシミュレートすると、実質的に不均一で小さなP値に富んだP値の分布が得られました。(EMが真の最大尤度に収束していなかった場合、正反対が予想されます。)このバイアスを生み出しているウィルクスの定理の私の適用の何が問題になっていますか?