Rの段階的回帰–クリティカルp値


12

step()段階的回帰のR の関数で使用される重要なp値は何ですか?0.15と仮定していますが、私の仮定は正しいですか?重要なp値を変更するにはどうすればよいですか?


7
Rの「ステップ」機能はAICベースです。
マイケルM

7
段階的なモデル選択ルーチンをまったく使用しないことをお勧めします。その理由を理解するために、ここでの私の答えを読むのに役立つかもしれません:自動モデル選択のアルゴリズム
GUNG -復活モニカ

3
@MichaelMayerのコメントDescriptionに加えて、ヘルプページの一部に、?step全体として:AICによる式ベースのモデルを選択します。
ステファンKolassa

回答:


27

他の質問に対するコメントで説明したように、stepp値ではなくAICを使用します。

ただし、一度に1つの変数に対して、AIC 0.15(より正確には0.1573)のp値を使用することに対応します。

1つの変数が異なる2つのモデルを比較することを検討してください。モデル(小さいモデル)およびM 1(大きいモデル)を呼び出し、それぞれのAICをそれぞれAIC 0およびAIC 1にします。M0M1AIC0AIC1

AIC基準を使用すると、場合、より大きなモデルを使用します。これは、ケース場合であろう- 2 ログL 0 - - 2 ログL 1> 2AIC1<AIC02logL0(2logL1)>2

しかし、これは尤度比検定の統計値にすぎません。統計は、上側超える場合Wilksの定理から、我々はヌルを拒否するだろうの分位χ 2 1。我々はより小さなモデルと大きく間で選択するために仮説検定を使用するのであれば、我々はときより大きなモデルを選択- 2 ログL 0 - - 2 ログL 1> Cのαをαχ122logL0(2logL1)>Cα

2χ1210.843=0.15715.7%


では、どのように変更しますか?

簡単です。kパラメーターをstep2から別のものに変更します。代わりに10%が必要ですか?2.7にする:

qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543

2.5%が必要ですか?セットk=5

qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886

等々。


ただし、それはあなたの質問を解決しますが、他の質問に対するフランク・ハレルの答えに細心の注意を払い、ここで段階的回帰に関連する他の質問に関する非常に多くの統計学者からの応答を検索することをお勧めします通常、段階的な手順を避けるために一貫して。


いい説明。これが通常の回帰t検定のp値にほぼ当てはまるかどうか知っていますか?
ベンオゴレク14

α=0.05

(ctd)... stepwiseの多数の深刻な問題。その他には、偏った推定値や非常に小さい標準誤差が含まれます。
Glen_b -Reinstateモニカ

1
段階的なモデル選択の問題を一時的に脇に置いて、私はより小さいAIC => .1573 p値ルールを一般化することに興味があります。説明する尤度比のp値は問題ありませんが、Rのlmなどのルーチンでは、timate / std.errはt分布と比較されています。これは別のテストであり、.1573の結果がほぼ保持されるかどうか疑問に思っていました。
ベンオゴレク14

2
ベン:はい、0.1573は漸近的です(通常に基づいています;ほぼ正しいだけです)。私はあなたがstepAICに対応するp値を計算できると思うt、それはあなたの問題の自由度にのみ依存するためです(例えば、200 dfで0.1579だと思います)。その結果、希望するものをバックアウトできるはずですk。@Nickそれが一番おもしろい。一見したところ、計算には直接的な関係はないと思います。計算量は同じですが、理由は異なります。
グレン_b-モニカを復元14

4

上記のように、stepR の関数はAIC基準に基づいています。しかし、p値では、入るアルファと出るアルファを意味すると思います。あなたにできることはstepwise、Paul Rubinによって書かれたここで利用可能な関数を使うことです。ご覧のとおり、alpha.to.enterおよびalpha.to.leaveの引数は変更可能です。この関数はF検定または同等のt検定を使用してモデルを選択することに注意してください。さらに、引数を適切に定義すると、ステップワイズ回帰だけでなく、前方選択と後方消去も処理できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.