「段階的モデル選択」とは正確には何ですか?


8

ステップワイズモデル選択のメリットについてはすでに説明しましたが、「ステップワイズモデル選択」または「ステップワイズ回帰」が正確に何であるかは、はっきりしなくなりました。私はそれを理解したと思ったが、もう確かではない。

私の理解では、これらの2つの用語は同義語であり(少なくとも回帰のコンテキストでは)、データが与えられた場合、「最適」または「最良」のモデルにおける予測変数の最適なセットの選択を指します。(ここにWikipediaのページがありここに役立つと思われる別の概要があります。)

以前のいくつかのスレッド(例:ここでは自動モデル選択のアルゴリズム)に基づいて、段階的なモデル選択は主要な罪と見なされているようです。それでも、それは、尊敬されている統計学者と思われるものを含め、常に使用されているようです。または、用語を混同していますか?

私の主な質問は:

  1. 「段階的モデル選択」または「段階的回帰」とは、次のことを意味します
    。A)尤度比検定などの逐次仮説検定を行うか、p値を調べるか。(ここに関連する投稿があります:段階的な選択を実行した後にp値が誤解を招くのはなぜですか?)これはそれが意味することであり、なぜ悪いのですか?
    または
    B)AIC(または類似の情報量基準)に基づく選択も同様に悪いと考えていますか?自動モデル選択のアルゴリズムの回答から、これも批判されているようです。一方、ウィッティンガム等。(2006; pdf1 情報理論(IT)アプローチに基づく変数選択は段階的選択とは異なることを示唆しているようです(有効なアプローチのようです)...?

    そして、これが私のすべての混乱の原因です。

    フォローアップするために、AICベースの選択が「段階的」に該当せず、不適切であると見なされる場合、追加の質問を次に示します。

  2. このアプローチが間違っている場合、なぜそれが教科書や大学のコースなどで教えられているのですか?それはすべて間違っていますか?

  3. モデルに残す必要がある変数を選択するための適切な代替手段は何ですか?相互検証とトレーニングテストデータセット、およびLASSOを使用するための推奨事項を見つけました。

  4. 考えられるすべての変数を無差別にモデルに投入し、段階的な選択を行うことには問題があることに誰もが同意できると思います。もちろん、いくつかの健全な判断は、最初に何が起こるかを導くべきです。しかし、いくつかの(たとえば生物学的)知識に基づいて、可能な限られた数の予測変数から始めて、これらすべての予測変数が私たちの応答を説明しているとしたらどうでしょうか。このモデル選択のアプローチにはまだ欠陥がありますか?また、異なるモデル間のAIC値が非常に類似している場合(およびそのような場合にマルチモデル推論が適用される場合)は、「最良の」モデルの選択が適切でない場合があることを認めます。しかし、AICベースの段階的選択を使用するという根本的な問題は依然として問題ですか?

    どの変数が応答をどのように説明しているように見えるのかを調べている場合、「すべてのモデルが間違っているが、一部は有用である」ことがわかっているため、なぜこのアプローチが間違っているのでしょうか。

1. Whittingham、MJ、Stephens、PA、Bradbury、RB、およびFreckleton、RP(2006)。なぜ生態学と行動でまだ段階的モデリングを使用するのですか?Journal of Animal Ecology、75、pp。1182〜1189。


ステップワイズ回帰を使用すると、AICとp値の両方が誤解を招きます。AICを使用した段階的回帰の例を含む直観的な説明は、ここにあります。metariat.wordpress.com
2016

3
参照している自動モデル選択スレッドのアルゴリズムで正確に不明確な点を明確にしていただけますか?それはあなたの質問のすべてに答え、かなり詳細な答えを与えているようです。基本的な質問への回答:段階的なモデルの選択では、いくつかの予測子を使用して回帰を行い、モデル改善のいくつかの基準に基づいて、一度に1つずつ(または1つずつ)ドロップして、「最良の」モデルを見つけます。
Tim

1
@ティム、遅れた反応についてお詫びします。いいえ、それは私の質問のすべてに答えるとは思いませんし、いくつかの問題は(私にとって)不明確なままです。1)さまざまなソースが異なる用語を使用しているため、用語を明確にしたかったので、私が参照している用語が同義語であるかどうかを完全に理解したかった。2)そのスレッドから、使用した基準に関係なく問題は同じであることを理解できましたが、文献にはそれと矛盾があります。3)紙と本を読むとき、何が適切で何が適切でないか(またはいつ)について意見の相違があるようです。
Tilen 2017年

1
4)私の質問の1つは、なぜそれが間違っていると考えられる場合に、なぜそれがまだ(明らかに知識のある名前で)教えられているのかということでもありました。これが過去のものであるか(特定の本の出版のタイミングを考えると、そうではないように思われる)、さまざまな学派、あるいは単なる無知なのかを理解したかったのです。5)候補の予測変数の最初のセットがすでに制限されている場合でも、このアプローチが間違っているかどうかを理解したかった。言い換えれば、私の個人的な関心は、すでに削減され、十分に検討されたセットを前提として、最良の予測子セットを見つけることです。
Tilen 2017年

1
結論として、自動モデル選択のためのアルゴリズムのスレッドは非常に有益で有用でしたが、それでも多くの質問と混乱を残しました。
Tilen 2017年

回答:


4

1)混乱しているのは、「段階的」という用語の使い方に一貫性がないためです。時にはそれはではかなり具体的な手順を意味しp通常の方法で計算された回帰係数の値は、モデルに追加または削除される共変量を決定するために使用され、このプロセスが数回繰り返されます。これは、(a)変数を任意のステップで追加または削除できるこの手順の特定のバリエーション(私はこれがSPSSが「ステップワイズ」と呼んでいるものだと思います)を参照するか、または(b)このバリエーションを他と一緒に参照します。変数の追加のみまたは変数の削除のみなどのバリエーション より広義には、「段階的」は、(c)機能(または機能のセット)が追加または削除されるたびに計算されるいくつかの値に従って、モデルに機能が追加または削除される手順を参照するために使用できます。

これらの異なる戦略はすべて、さまざまな理由で批判されてきました。ほとんどの批評は(b)に関するものだと思いますが、その批判の重要な部分は、値が特徴選択に十分に備えられていないことです(ここでの重要度テストは、「この変数をモデル?」)、そして最も深刻な統計学者は、あらゆる状況でそれを推奨しません。(c)はもっと物議を醸しています。p

2)統計教育が本当に悪いからです。一例を挙げれば、私自身の教育からわかる限り、心理学専攻の統計教育の重要な部分として、ベッセルの修正を使用して母集団SDの偏りのない推定値を取得するように生徒に指示することは明らかに考えられます。ベッセルの修正により分散の推定が不偏になることは事実ですが、SDの推定が依然としてバイアスされていることを証明するのは簡単です。さらに良いことに、ベッセルの修正により、これらの推定値のMSE が増加する可能性あります。

3)変数の選択は、実際にはそれ自体がフィールドです。交差検証とトレーニングテストの分割は、モデルを評価する方法です。使用する機能についての提案はありません。なげなわはしばしば良い選択です。だから最高のサブセットです。

4)私の考えでは、(b)を使用することはまだ意味がありません。特に、AICを使用するなど、代わりに(c)で他のことができる場合は特に意味がありません。私はAICベースの段階的な選択に異論はありませんが、それはサンプルに敏感になることに注意してください(特に、サンプルが任意に大きくなると、ラッソのようなAICは常に最も複雑なモデルを選択します)。モデル選択自体を、それが一般化可能な結論であるかのように提示する。

どの変数が応答をどのように説明しているように見えるかを確認する場合

最終的に、すべての変数の影響を見たい場合は、すべての変数を含める必要があります。サンプルがそれに対して小さすぎる場合は、より大きなサンプルが必要です。覚えておいてください、帰無仮説は実際の生活では決して真実ではありません。変数の束があるように予定されていないされている結果と他の変数の束に関連付けられていません。すべての変数は結果に関連付けられます。問題は、どの程度、どの方向に、他の変数とどのように相互作用するかなどです。


再(4):@gungは、stats.stackexchange.com/questions/20836の段階的手順に対する彼の批判に対して220票を獲得していますが、そのような批判は、p- value-とまったく同じ方法でAICベースの手順に適用されると思いますベースのもの。
アメーバ2017年

@amoebaフランクハレルの番号付きポイントは、主に(b)に当てはまるようです(そして、彼のポイント9は利点であり、欠点ではありません)。Gungによるモデル選択のオーバーフィットの説明は正しいですが、それがモデル検証の目的であり、問​​題はすべてのモデル選択シナリオに
当てはまり

3
Gungの答えとそこに引用されているFrankのポイントは、外部モデルの検証なしの段階的な選択に関するものだと思います。明らかに、段階的選択が交差検証ループに入れられた場合、たとえそれがp値に基づいていても、原理的な問題はありません。過剰に適合している場合は、相互検証済みのパフォーマンスで確認できます。「大きくバイアスされているR-2乗値を生成する」のような批判は、相互検証なしで行われた場合にのみ意味があります。
amoeba 2017年

@amoeba私は推測しますが、私の回答で言ったことと一致して、値ベースのメソッドが、たとえばAICに基づくメソッドよりも優れているとは思えません。数学的な動機はありません。p
コディオロジスト2017年

@Kodiologist、回答ありがとうございます。とても役に立ちます。1)その後のコメントは私にとって啓示でした。他のスレッドでのこの議論全体が、モデル検証がないという前提に基づいていることに気づきませんでした。変数の選択方法に関係なく、モデルの検証はいずれにしても重要な部分であると考えました。2)悪い教育に関しては、どうやら尊敬されている人々/大学/本がそれを教えたり使用したりしているようで、私はまだ困惑しています。たとえば、Zuur et al。2009(Rを使用したエコロジーの混合効果モデルと拡張機能)、およびその他(Faraway 2005、2006と誤解しない限り)。
Tilen

2

段階的対AICについて

ステップワイズは、モデルのシーケンスが構築される方法と、おそらくシーケンス内でモデルが選択される方法を説明する用語です。

  • 段階的なモデル構築、変数は変数のどれを定義するいくつかの規則に従って一つまたはグループ内ずつ追加または削除された/追加する/除去されています。これは、Kodiologistのポイント(c)と一致しています。
  • 段階的モデル選択、一方がシーケンス内のモデルに隣接比較し、検討中のモデルがその隣接(先行および後続もの)の両方に優れた表示されたときに停止します。これは、モデルのさまざまなプロパティ(AIC値、p値など)を調べることで実行できます。

その間、

AICは、特定のデータセットの統計モデルの相対的品質の尺度です。(ウィキペディア

AICを適用して、候補のプールからモデルを選択できます。これは、段階的選択の選択基準として使用できますが、それだけではありません。

したがって、ステップワイズAICは、一緒にまたは個別に使用できるモデル選択の2つの異なる側面であり、それと他の考慮事項に応じて、適切な場合とそうでない場合があります。


役立つ回答もありがとうございます。はい、AICを段階的とは別に使用できることを知っています。しかし、私の分野(生物学)では、応答の予測因子候補に直面することがよくあります。その結果、利用可能な最良の生物学的知識と注意深い思考があっても、少数の事前に定義されたモデルの小さなセットを構築し、それらを比較する(前方または後方の段階的な選択、またはすべての可能な組み合わせ(浚渫)なしで)は、多くの場合不可能です。そのような場合の最善の方法は何か他のアドバイスはありますか?
Tilen

@Tilen、正則化された推定はしばしば良い考えです。たとえば、弾性ネットまたはその特殊なケース(投げ縄と尾根)が役立ちます。部分最小二乗法は別の方法です。
Richard Hardy

よろしくお願いいたします。これらの方法は、たとえばAICベースの段階的な手順よりもはるかに複雑ですか、それとも単に新しいですか。私が尋ねる理由は、統計モデリングのコースと本(少なくとも導入または基本的なものですが、evnが適用されている)が、参照した方法ではなく、段階的な手順(p値とAICベースの両方)を含んでいるように見える理由を理解するためです。
Tilen

@Tilen、おそらく両方。
Richard Hardy

そうですか。直接関連しているが別の質問について考えているかどうか疑問に思います:stats.stackexchange.com/questions/265572/…
Tilen
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.