段階的な選択を実行した後にp値が誤解を招くのはなぜですか?


28

たとえば、線形回帰モデルを考えてみましょう。データマイニングで、AIC基準に基づいて段階的な選択を行った後、p値を見て、各真の回帰係数がゼロであるという帰無仮説をテストするのは誤解を招くと聞きました。代わりに、モデルに残っているすべての変数がゼロとは異なる真の回帰係数を持っていると考える必要があると聞きました。誰も私に理由を説明できますか?ありがとうございました。



1
theoreticalecology.wordpress.com/2018/05/03/...、私はAIC選択した後、I型インフレを実証するいくつかのRコードを示しています。段階的であれグローバルであれ、問題ではないことに注意してください。ポイントは、モデルの選択は基本的に複数のテストであるということです。
フロリアンハーティグ

回答:


33

AIC基準に基づいて段階的な選択を行った後、p値を見て、各真の回帰係数がゼロであるという帰無仮説をテストすることは誤解を招きます。

実際、p値は、帰無仮説が真である場合に、少なくともあなたが持っているものと同じくらい極端な検定統計量を見る確率を表します。場合真である、p値は、均一な分布を持っている必要があります。H0

しかし、段階的な選択の後(または実際、モデル選択へのさまざまな他のアプローチの後)、モデルに残っているそれらの項のp値は、帰無仮説が真であることがわかっていても、その特性を持ちません。

これは、(使用した正確な基準に応じて)p値が小さいまたは小さい傾向がある変数を選択するために発生します。これは、モデルに残された変数のp値は、通常、単一のモデルを近似した場合よりもはるかに小さいことを意味します。モデルのクラスに真のモデルが含まれている場合、またはモデルのクラスが真のモデルに非常に近い柔軟性を持っている場合、選択は平均して、真のモデルよりもさらに適合すると思われるモデルを選択します。

[さらに、基本的に同じ理由で、残っている係数はゼロから遠ざかり、標準誤差は低く偏ります。これは、信頼区間と予測にも影響します。たとえば、予測は狭すぎます。]

これらの効果を確認するには、いくつかの係数が0であるものとそうでないもので多重回帰を行い、ステップワイズ手順を実行してから、係数がゼロの変数を含むモデルについて、結果のp値を調べます。

(同じシミュレーションで、係数の推定値と標準偏差を調べて、ゼロ以外の係数に対応するものも影響を受けることを発見できます。)

つまり、通常のp値を意味のあるものと見なすことは適切ではありません。

代わりに、モデルに残っているすべての変数を重要とみなすべきだと聞きました。

ステップワイズ後のモデル内のすべての値を「有意とみなす」べきかどうかについては、それをどのように見るのが有用な方法なのかわかりません。「意味」とはどういう意味ですか?


以下stepAICは、n = 100のシミュレートされた1000個のサンプルと10個の候補変数(いずれも応答に関連しない)でデフォルト設定でRを実行した結果です。いずれの場合も、モデルに残っている用語の数がカウントされました。

ここに画像の説明を入力してください

正しいモデルが選択されたのは15.5%だけでした。残りの時間には、モデルにはゼロと変わらない用語が含まれていました。候補変数のセットに係数ゼロの変数があることが実際に可能である場合、モデルの真の係数がゼロである項がいくつかある可能性があります。その結果、それらすべてを非ゼロとみなすことは良い考えだとは明確ではありません。


文では、私は意味「私は1つが重要な代わりとしてモデルに残されたすべての変数を考慮すべきであることを聞いた」:「私は1つが別の代わりに、フォームのゼロを真の回帰係数を持つものとしてモデルに残されたすべての変数を考慮すべきであることを聞きました」
ジョンM

はい; そのことを示すシミュレーションの結果を追加しました。
グレン_b-モニカの復活

10
+1今週末、同じモデルを使用して、モデル選択方法のクラスを準備していました。Iは、探索結果の同一のパターンを得へ変数と使用観測。次のステップは、ボンフェローニ補正が何をするかを確認することです... 39 10 kk=33910k
whuber

7
@whuber確かに、Bonferroniがどのような影響を与えるか(問題のさまざまな面で)を確認することは、上記のシミュレーションを完了することに対する私の即時の傾向でもありましたが、それは人々が実際に段階的に行う傾向がないため、私は対処しませんでしたここに。モデルの選択方法について議論するのを聞いて私は魅了されるでしょう。かなり学ぶことになると思います。
Glen_b-モニカを復活させる

@Glen_b:(あなたの答えから引用)これは、モデルに残っている変数のp値は、「適合する1つのモデルがたまたまある場合でも、単一のモデルを適合させた場合よりも一般的にはるかに小さいことを意味します真のモデルがヌルかどうかにかかわらず、データを生成したもの」。ハイライトされた部分について少し説明してもらえますか?データ生成プロセスと同じ仕様を持つモデル(真のモデル)でp値が小さくなるのはどのようになりますか?
シャニ

8

類推が役立つかもしれません。候補変数が相互排他的なカテゴリ(ANOVAなど)を表すインジケーター(ダミー)変数である場合の段階的回帰は、検定で最小の差があるグループを見つけて結合するグループを選択することに正確に対応します。元ANOVAは、に対して試験した場合が、最終折り畳ま基がに対してテストさ得られた統計はないではない持っている分布および偽陽性の確率は制御不能になります。F p 1 n p 1 F q 1 n q 1 q < p FtFp1,np1Fq1,nq1q<pF

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.