変数選択に対する矛盾するアプローチ:AIC、p値、またはその両方?


13

私が理解していることから、(少なくとも回帰コンテキストでは)p値に基づいた変数選択には大きな欠陥があります。AIC(または同様の)に基づく変数の選択も、同様の理由でいくつかの欠陥があると考えられますが、これは少し不明瞭に見えます(たとえば、このトピックに関する私の質問といくつかのリンクを参照してください)。

ただし、これら2つの方法のいずれかを使用して、モデル内の最適な予測子のセットを選択するとします。

Burnham and Anderson 2002(モデル選択およびマルチモデル推論:実用的な情報理論的アプローチ、83ページ)では、AICに基づく変数選択と仮説検定に基づく変数選択を混在させないでください:「帰無仮説および情報理論的アプローチのテスト一緒に使用しないでください。これらは非常に異なる分析パラダイムです。」

一方、Zuur et al。2009(R、ページ541とエコロジーで拡張子を持つ混合効果モデル)の使用を提唱するように見える最初の最適なモデルを見つけ、その後、仮説検定を使用して「微調整」を実行するAICを:「欠点はAICが保守的であることができるということです、AICが最適なモデルを選択したら、(アプローチ1からの仮説検定を使用して)微調整を適用する必要がある場合があります。」

これにより、どちらのアプローチに従うべきかについて、両方の本の読者が混乱していることがわかります。

1)これらは、統計的思考の異なる「キャンプ」であり、統計学者の間の不一致のトピックですか?これらのアプローチの1つは、単に「時代遅れ」になっていますが、執筆時点では適切と考えられていましたか?または、最初から単純に間違っているのでしょうか?

2)このアプローチが適切となるシナリオはありますか?たとえば、私は生物学的背景から来ています。そこでは、どの変数が応答に影響を与えているか、またはそれを推進しているように見えるかを判断しようとしています。多くの場合、説明変数の候補がいくつかありますが、どちらが「重要」かを(相対的な観点から)見つけようとしています。また、候補予測変数のセットは、生物学的関連性があると考えられるものに既に削減されていますが、これには5-20の候補予測変数が含まれている場合があります。


3
AIC選択後の仮説検定で微調整するために、Zuurの統計的議論はどうなるのだろうか。モデル構築の一貫した戦略とは思えません。しかし、私はそれらのことについて十分に知りません。
リチャードハーディ

2
私の考えでは、Zuurらの提案は悪いことです(モデル選択に有意性検定を使用する理由はありますか?)いい質問ですが、答えるには、これまで読んだよりも技術的な詳細をもっと深く読む必要があります。
-Kodiologist

モデルで両方の方法を使用して、パネル販売を予測しました。AICベースの段階的後方回帰は、私の経験からより良い結果を与えるように見えました。
スープティックダー

1
@SouptikDhar、「より良い」結果を言うとき、正確にはどのような意味ですか?
ティレン

たぶん答えは分析の目的に依存していますか?観察研究では、データセットが与えられた最も重要なモデルを見つけることが望ましい場合があります。したがって、たとえば「AICに基づく変数選択」に依存します。ただし、目的が仮説を検定に置くことである場合、モデルは、仮説に対する関心のある変数の適切なプロキシに関する仮説の変換であるため、最初からすでに指定されているため、変数選択IMHO?
ロドルフ

回答:


6

短い答え。

データ駆動型モデルの選択または調整を行い、その後、選択/調整されたモデルで標準の推論方法を使用するアプローチ(Zaur 、およびCrawleyなどのその他の多くの尊敬される生態学者)は、常に過度に楽観的な結果をもたらします。間隔(カバレッジが不十分)、p値が小さすぎる(タイプIエラーが高い)。これは、標準の推論方法では、モデルがアプリオリに指定されていると仮定するためです。モデルの調整プロセスは考慮されていません。

これが、Frank Harrell(Regression Modeling Strategies)のような研究者が、ステップワイズ回帰のようなデータ駆動型選択手法を強く承認せず、モデルの複雑さの削減(「次元削減」、予測変数のPCAの計算など)予測変数としてのみ見て、最初のいくつかのPCA軸を予測変数として選択します。

最良の予測モデルを見つけることにのみ関心がある場合(そして、予測の不確実性のいかなる種類の信頼できる推定にも関心がなく、推論の領域に該当する場合)、データ駆動型モデルの調整は問題ありません(ただし、段階的な選択が利用可能な最良のオプションであることはめったにありません。機械学習/統計学習アルゴリズムは、最適な予測モデルを取得するために多くの調整を行います。「テスト」または「サンプル外」エラーは、別個の保留サンプルで評価する必要があります。または、任意の調整方法を相互検証手順に組み込む必要があります。

このトピックに関する意見には歴史的な進化があったようです。多くの古典的な統計教科書、特に回帰に焦点を当てたものは、モデル選択の影響を考慮せずに標準的な推論手順が続く段階的なアプローチを提示します[要出典...]

変数の重要性を定量化する方法は数多くありますが、すべてが変数選択後のトラップに該当するわけではありません。

  • BurnhamとAndersonは、AICの重みを合計することを推奨しています。このアプローチにはかなりの意見の相違があります。
  • (適切にスケーリングされた/単位なしの予測子を使用して)完全なモデルに適合し、予測されたマグニチュード[生物学的効果サイズ] または Zスコア["明瞭度" /統計的効果サイズ]で予測子をランク付けできます。

1

私は生物学的背景を持ち、大学病院で働いている生物統計学者です。特に最近、特にwwwに対するHarrellの意見と、彼の著書Regression Modeling Strategiesを読んで、これについてよく読みました。もう彼を引用するのではなく、経験から言えば、それは非常に分野に関連している、私はこれが考慮されるべき最初のレベルだと思う。2番目のレベルは、適切な合理的なアプローチを取得することです。つまり、予測は、科学的経験によって、予測したいことを表現するために意味のあるコアでなければなりません。3番目は相互作用を考慮することであり、これは非常に重要であり、統計的アプローチまたは洞察によって対処できます。私の場合、病院のデータを使用する場合、4番目だけが選択されます。これは、たとえば、

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.