AICまたはp値:モデル選択のためにどれを選択しますか?


22

私はこのRに関してはまったく新しいのですが、どのモデルを選択すればよいかわかりません。

  1. 最も低いAICに基づいて各変数を選択して、段階的な前方回帰を行いました。どのモデルが「ベスト」かわからない3つのモデルを思いつきました。

    Model 1: Var1 (p=0.03) AIC=14.978
    Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = 12.543
    Model 3: Var1 (p=0.04) + Var2 (p=0.04) + Var3 (p=0.06) AIC= -17.09
    

    モデル#3にはAICが最も低く(ネガティブは大丈夫だと聞いた)、p値がまだかなり低いため、モデル#3を使用する傾向があります。

    Hatchling Massの予測変数として8つの変数を実行しましたが、これら3つの変数が最適な予測変数であることがわかりました。

  2. AICが少し大きかったとしても、p値はすべて小さかったため、次の段階的なモデル2を選択しました。これが最高だと思いますか?

    Model 1: Var1 (p=0.321) + Var2 (p=0.162) + Var3 (p=0.163) + Var4 (p=0.222)  AIC = 25.63
    Model 2: Var1 (p=0.131) + Var2 (p=0.009) + Var3 (p=0.0056)                  AIC = 26.518
    Model 3: Var1 (p=0.258) + Var2 (p=0.0254)                                   AIC = 36.905
    

ありがとう!


(1)と(2)の違いを教えてください。(1)のモデル3と(2)のモデル2は名目上同一ですが、p値とAICが異なるため、明らかに何かが変わりました。
whuber

2
この質問は2回再投稿されました。つまり、それらを閉じる必要があるだけでなく、すでに提供された関連する応答も再投稿されます。アカウントを登録して(FAQを参照)、今後StackExchangeの投稿ポリシーに注意してください。ありがとう。
CHL

@whuber、あなたの質問を完全に理解していないのではないかと思う。おそらく私の統計的な理解の欠如でしょう。しかし、明確にしようとする。モデル1には4つの変数があり、モデル2には3つの変数があり、モデル3には2つの変数があります。変数はすべてのモデルで同じ順序です(つまり、変数one = tempは各モデルで)。@GaBorgulyaと@djmaは私の質問に完璧に答えたと思います。変数4は変数3と相関しています。AH-HA!理にかなっています。おかげで大騒ぎ!
MEL

上記のコメントに対する回答を変換しました。現在の回答のいずれかがあなたを助けた、またはあなたの質問に答えたと感じたら、@ richiemorrisroeが親切に思い出したように、それを受け入れることを忘れないでください。ところで、あなたがあなたのアカウントを登録したのを見てうれしいです。
-chl

回答:


23

AICは適合度の尺度であり、モデル内の小さな残留誤差を優先しますが、予測子を追加することでペナルティを与え、過剰適合の回避に役立ちます。2番目のモデルセットでは、モデル1(AICが最も低いモデル)が、データセット外の予測に使用された場合に最高のパフォーマンスを発揮します。Var4をモデル2に追加するとAICが低くなるが、p値が高いのは、Var4がVar1、2、および3とある程度相関しているためであると考えられる説明です。したがって、モデル2の解釈は簡単です。


31

個々のp値を見ると誤解を招く可能性があります。共線性のある(相関が高い)変数がある場合、大きなp値が得られます。これは、変数が役に立たないという意味ではありません。

簡単な経験則として、AIC基準を使用してモデルを選択する方が、p値を調べるよりも優れています。

AICが最も低いモデルを選択しない理由の1つは、変数とデータポイントの比率が大きい場合です。

モデルの選択と予測の精度は、多少異なる問題であることに注意してください。目標が正確な予測を取得することである場合、トレーニングセットとテストセットでデータを分離することにより、モデルを相互検証することをお勧めします。

変数選択に関する論文:変数選択のための確率的段階的アンサンブル


4
目標が予測精度である場合、AICを使用します(近似モデルと真実の間の予想されるKL発散を最小化するため)。一貫したモデル選択手順(pを固定、nを増加)が必要な場合は、代わりにBICなどを使用できます。段階的回帰でp値を使用して仮説を選択することは、絶対に推奨されません。
emakalic

8
0.154|t|>ログN

-3

AICは、一般化エラーの推定に基づいています(マローのCP、BICなど)。予測用のモデルが必要な場合は、これらの基準のいずれかを使用することをお勧めします。現象を説明するモデルが必要な場合は、p値を使用します。

こちらもご覧ください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.