回答:
2つのモデルを比較することはできません。同じ変数をモデル化していないためです(正しく認識しているため)。それでも、ネストされたモデルとネストされていないモデルの両方を比較する場合、AICは機能するはずです。
続行する前の注意点:ガウスの対数尤度は
はモデルの共分散構造、データセットのポイント数、平均応答、従属変数。μ X
より具体的には、AICはに等しくなるように計算されます。ここで、はモデルの固定効果の数、は尤度関数[1]です。モデリングの仮定における分散()とバイアス()のトレードオフを実際に比較します。このように、バイアス項に関しては、2つの異なる対数尤度構造を比較します。これは、対数尤度を実際に計算するときに、2つの用語を見るためです。-、およびで表される複雑性ペナルティ項k L 2 k 2 log (L )− 1-1。したがって、2つのモデル間で近似項が完全に異なることがわかります。最初のケースでは生データからの残差を比較し、他のケースではログデータの残差を比較します。
ウィキペディアとは別に、AICは次のように定義されています: [3]; この形式は、異なる従属変数を持つ異なるモデルが比較できない理由をさらに明確にします。RSSは2つのケースであり、2つの間で比較することはできません。
赤池のオリジナルの論文[4]は実際には把握するのが非常に難しい(と思う)。これはKL発散(大まかに言えば2つの分布の差)に基づいており、データの未知の真の分布を近似し、モデルが想定するデータの分布と比較する方法を証明することに役立ちます。それが「AICスコアが小さいほど良い」という理由です。データのおおよその真の分布に近くなります。
したがって、AICを使用するときに覚えておくべき明らかなことは3つあります[2,5]。
異なるデータセットのモデルを比較するために使用することはできません。
すべての候補モデルに同じ応答変数を使用する必要があります。
が必要です 、それ以外の場合は、良好な漸近的整合性が得られないため。
悪い知らせを伝えるのは残念ですが、AICを使用して、ある従属変数を別の従属変数よりも選択していることを示すことは、統計的に健全なことではありません。両方のモデルで残差の分布を確認します。ログに記録されたデータケースが残差を正常に分布し、生データケースがそうでない場合は、必要なすべての正当化があります。また、生データが対数正規分布に対応しているかどうかを確認することもできます。これは正当化に十分かもしれません。
厳密な数学的仮定のために、ゲームはKL発散と情報理論です...
ああ、そしていくつかの参照:
原則としてAICを使用して比較できるはずです。「AIC」と呼ばれる数字が必要な数字ではないというだけです。正規分布と対数正規分布を比較しています。これで、モデルからのAIC uu0
は基本的に、ログ変換の「ヤコビアン」を欠いています。対数正規モデルの場合、これは単にです。これをAICに変換するには、この項の2回の負のログを取る必要があり。つまり、のAIC番号にを追加する必要があり。だからあなたはと比較されている必要があります
uu0
AIC (uu0)+2*sum (log (usili))
AIC (uu1)
AIC()