AICとシュワルツ基準を理解する


13

ロジスティックモデルを実行しています。実際のモデルデータセットには10​​0を超える変数がありますが、約25の変数があるテストデータセットを選択しています。その前に、8〜9個の変数を持つデータセットも作成しました。AICとSCの値を使用してモデルを比較できると言われています。変数のp値が低い場合(ex。0053)でも、モデルのSC値が高いことがわかりました。私の直感では、有意水準が高い変数を持つモデルは、SCとAICの値が低くなるはずです。しかし、それは起きていません。誰かがこれを明確にしてください。要するに、私は次の質問をしたい:

  1. 変数の数はSC AICと関係がありますか?
  2. p値または低いSC AIC値に集中すべきですか?
  3. SC AIC値を減らす典型的な方法は何ですか?

回答:


15

質問に正確に答えることは非常に困難ですが、私には、同じ情報を提供しない2つの基準(情報基準とp値)を比較しているようです。すべての情報基準(AIC、またはシュワルツ基準)については、それらが小さければ小さいほど、モデルの適合度が高くなります(統計的観点から)。それらは、適合度の欠如とモデルのパラメーター数とのトレードオフを反映しているためです; 例えば、赤池基準は、読み出しK2ログ+2kkパラメータの数です。ただし、AICとは異なり、SCは一貫しています。サンプルサイズが大きくなると、より大きなモデルを誤って選択する確率が0に収束します。これらはモデルの比較に使用されますが、適合度が低い(残留偏差が大きい)重要な予測子を持つモデルをよく観察できます。より低いAICで別のモデルを実現できる場合、これは貧弱なモデルを示唆しています。また、サンプルサイズが大きい場合は、p値は依然として低くなる可能性があり、モデルの適合に関する多くの情報が得られません。少なくとも、モデルを切片のみと比較し、モデルを共変量と比較したときにAICが大幅に減少するかどうかを確認します。ただし、予測子の最適なサブセットを見つけることに関心がある場合、変数選択の方法を明確に検討する必要があります。

過剰適合の問題を回避するために変数選択を実行できるペナルティ回帰を検討することをお勧めします。これについては、フランク・ハレルの回帰モデリング戦略(p。207 ff。)、またはMoons等、過オプティミズムの診断および予後予測モデルを直接調整するペナルティ付き最尤推定:臨床例、J Clin Epid(2004)57( 12)。

Designlrm)およびstepPlrstep.plr)Rパッケージ、またはペナルティパッケージも参照してください。このSEの変数選択に関する関連質問を参照できます


こんにちはchl、返信ありがとう。私はあなたの答えからいくつかの情報を得たと認めます。(1)サンプルサイズが大きい場合、P値が下がる可能性があるというヒントが得られます...-そうですか?? 私の理解では、p値は、帰無仮説が棄却されるかどうかを示すだけです。(2)インターセプトのみと共変量のAIC値の違いを確認する必要があることを理解しました。AICを低くしたいというのは、同じデータセットを意味すると思います。私はコメントにキャラクターキャラクターが残っているので、あなたが答えてくださいと再度コメントします。
ayushbiyani

1
@ayush(1)テスト統計(Waldなど)はサンプルサイズに依存します(サンプルサイズが大きくなると標準誤差が小さくなり、サンプルが大きくなるとp値が低くなります)。(2)はい、AICはネストされていないモデルを比較するために使用できますが、ここでは、複雑さを増すさまざまなモデルを比較する方法として考えていました。
chl

再びありがとう..私は今、p値の本質を得る。5分ほど前に、インターセプトのみと共変量21507.933を使用した28238.407のAIC以外のすべての変数について、p値が.05未満のモデルを実行しました。また、AICが16035.xyで、切片のみと共変量4234.xyの場合もあります。2つのケースを比較するあなたの意見は何ですか?2番目のモデルには25 varの異なる変数があり、最初のモデルには20の変数があったことに注意してください。すべてのp値は.05ではありませんでした。提案してください..この後に尋ねる..ありがとう。
アユシュビヤニ

@ayush変数の選択方法を知らずにモデルの品質について答えることは困難です。切片といくつかの共変量のみを含むモデル間のAICのギャップは、それらの予測子の「説明力」に関する指標を提供します(示された2番目のケースでは、残留偏差が大幅に減少するようであり、AICはペナルティを科します) #応答で言ったとおりのパラメーター)。これらの予測変数の関連性に関する完全な答えではありません。特定の研究のためのGLMの変数選択など、より具体的な質問(IMO)を求めることをお勧めします。
chl

8

SCとAICを一緒にグループ化するのは間違っています。人々はそれらを非常に誤用しているにもかかわらず、それらは非常に異なるものです。AICは、物事を予測するときに意味があります。このシナリオでSCを使用すると、(常にではなく)間違った結果が生じる可能性があります。同様に、節約(Occam's Razor)の原理でモデルを選択することに興味がある場合は、SCの方が優れています。理論的な詳細には触れたくありませんが、簡単に言えば、SC-データを説明するための最も単純なモデルに相当するもの、AIC-予測したい場合のpar約モデルに適しています。AICは、SCがそうであるように、実際のモデルがモデル空間にあるとは想定していません。

次に、chlで説明されているように、p値と情報基準を一緒に使用することも誤解を招く可能性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.