「段階的回帰」はどのように機能しますか?


11

次のRコードを使用して、プロビットモデルを適合させました。

p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1)
stepwise(p1, direction='backward/forward', criterion='BIC')

私は何をしstepwisebackward/forward正確に行い、変数をどのように選択するのか知りたいですか?


7
段階的回帰が悪い理由についてのFrank Harrell(stats.stackexchange.com/users/4253/frank-harrell)のコメント:stata.com/support/faqs/statistics/stepwise-regression-problems

4
BabakPのリンクに加えて、サイトからのこの投稿もご覧ください。
COOLSerdash 2013

3
しかし、(前方だけでなく後方と)段階的に問題に関する別のポストは、私はデビッド・カッセルと書いた紙である:段階的停止
ピーターFlomは-復活モニカ

@PeterFlom、この論文を参照するために、適切な引用を理解するのにいくつか問題があります。ここに記載していただけますか?ありがとう。
doug.numbers 2014年

2
@ doug.numbersさまざまな場所で発表され、会議の議事録の一部として公開されました。「Flom、Cassell、Stepwise」のGoogleを使用している場合は、それが表示された場所を取得し、フォーマットを設定できますが、公開されたプレゼンテーションの引用はフォーマットします。
ピーターフロム-モニカの

回答:


10

段階的選択の原則

  1. 必要なすべての変数を使用してモデルを適合させます。これはあなたの現在の最高のモデルです。
  2. あなたは一つの変数を削除(または現在の最良のモデルで使用されていない変数のうち、1を追加)、およびそれぞれのために、あなたは新しいモデルに合わせて、あなたはによると、各超えると、元のものとそれらを比較BIC(または任意のAICなどの他の基準)。別の「現在のベストモデル」を取得します。

BICの減少がなくなるまで2.を繰り返します。局所的な最小BICしかありません。つまり、変数のサブセットの可能なすべての選択肢の中から最適なモデルを取得できない場合があります。とにかく、通常はそれらが多すぎるため、これはあまり作業をせずに少し最適化する方法です。

ウィキペディアのステップワイズ回帰モデル選択も参照してください。


5

ステップワイズ回帰は基本的に、指定された基準に基づいて一度に1つずつ共変量を追加/削除することにより、回帰モデルに適合します(上の例では、基準はBICに基づいています)。

forwardを指定することRで、最も単純なモデル(つまり、1つの共変量)から始めて、一度に1つの共変量を追加し、モデルのBICに改善をもたらすもののみを維持することを伝えます。

後方を指定することRで、完全なモデル(つまり、すべての共変量を含むモデル)から始めて、共変量を一度に1つずつ削除して、BICを改善することを伝えています。

ステップワイズ回帰は、最適なモデル選択手順ではないため、非常に危険な統計手順になる可能性があります。この方法では、多重比較などの問題から保護されないため、モデルの選択が非常に不十分になる可能性があります。


ありがとう。そして、「後方/前方」はどうですか?
Mahmoud

後方/前方はどういう意味ですか?

Rのstpewise()のメソッドの1つは「後方/前方」です!両方の組み合わせですか?
Mahmoud

2
申し訳ありません、今私はあなたが何を求めているのか理解しました。はい。両方を指定すると、前方と後方の両方に適用され、最適な基準の1つが選択されます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.