モデル選択におけるAICとp値の同等性


9

この質問の回答に対するコメントで、モデル選択でAICを使用することは、0.154のp値を使用することと同等であると述べられました。

私はそれをRで試しました。「後方」サブセット選択アルゴリズムを使用して、完全な仕様から変数をスローしました。1つ目は、p値が最も高い変数を順次スローし、すべてのp値が0.154を下回ったときに停止します。次に、変数を削除して、改善が見られなくなるまで削除すると、AICが最も低くなります。

0.154のp値をしきい値として使用しても、ほぼ同じ結果になることがわかりました。

これは本当ですか?もしそうなら、誰もが理由を知っていますか、それを説明する情報源を参照できますか?

PS登録したばかりなので、コメントを書いたり、コメントを書いたりすることができませんでした。これはモデルの選択や推論などに最適なアプローチではないことを認識しています。


(1)ロジスティック回帰分析による予後モデリング:小さなデータセットでの選択方法と推定方法の比較。Statistics in Medicine、19、1059-1079(2)aicの定義に基づくdf1の変数に当てはまります。ただし、変数の自由度が高い場合は低くなる可能性があります
charles

回答:


13

統計的検定またはAICを使用して行われる変数の選択には、非常に問題があります。テストを使用する場合、AICは対応する = 2.0のカットオフを使用します。AICを個々の変数に使用しても、新しいことは何もありません。0.05よりも妥当な使用するだけです。より合理的な(推論を妨げない)は0.5です。χ2χ2α=0.157αα


+1(削除済み)の回答を作成するのに長い時間を費やしましたが、その間に投稿された回答を見ることさえありませんでした。代わりにこれを投票しただけです。
Glen_b-モニカを2014
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.