完全(グローバル)回帰モデルに基づく推論は適切ですか?


7

完全なモデルに基づく推論は適切であり、適切な場合はどのような状況ですか?

応答変数といくつかの候補予測子変数の間の潜在的な関係に関心があり、何らかの形の回帰(たとえば、一般化線形モデル)を使用してそれに答えるとします。どの予測因子が「重要」であるか、または応答と明らかに真の関係にあるかを推測する1つのアプローチは、情報理論的基準(たとえばAIC)に基づくモデル比較です。最終モデルで保持されない変数は応答とある程度の関係があるかもしれませんが、モデルに保持されている他の予測子を考えると、それらは本質的に追加の実質的な情報を提供しません。

完全な(グローバル)モデル(すべての候補予測子を含む)を単純に当てはめて、そこで停止し、t統計(または他の統計)とp値のみに基づいて個々の予測子に基づいて推論する方が適切な場合はありますかこの完全なモデルでは、さらにモデルを選択する必要はありませんか?

私は、潜在的な欠点はあるものの、これを行うのが賢明なことかもしれないという提案に遭遇しました(例:Whittingham et al。「なぜなぜ生態学と行動に段階的モデリングを使用するのですか?」(2006)。偏りはありませんが、モデルの他の(「重要でない」)変数がそれらに影響を与える可能性があるため、他のソースはこれらの推定値とp値は信頼できないと述べています。

潜在的な生物学的関係を理解することを目的とする場合、どの方法がより適切でしょうか?


以下の回答を改善するために言及されている「その他の情報源」を提供してください。
mzunhammer 2017年

@mzunhammer、私はそもそもそれをしたかったのですが、それらのソースを再び追跡することができませんでした。どの紙にそれを読んだか思い出せず、まだ見つけられませんでした。:)しかし検索を続けます。
Tilen

回答:


4

すべてはあなたの研究の目的に依存します:

A)探索的研究:あなたの目的は、関係について潜在的に興味深い多数の予測子をスクリーニングすることです。これらの探索的結果に基づいて、テスト可能なモデルを構築したいとします。推論(帰無仮説有意性検定の意味で)、または他の重要な決定は研究から引き出されません。この試験はパイロット試験であり、その後に別の確認/事前指定の試験が続きます。この場合、モデル選択手順(AIC、BIC、または交差検証手法を使用)が選択できる方法です。あなたが引用した参照は正しいです:最終モデルの予測子について得られたp値は過度に楽観的になります:基本的にモデル選択で多くの異なるモデルを試すことにより、複数の比較問題を作成しました— 「分岐パスの庭」。従来の統計検定では、現在のモデルのみのp値が得られ、これらの多重比較を制御することはできません。

B)確認/「事前に指定された」調査:この場合、理想的には、調査が実施される前に事前に指定された単一のモデルをテストする必要があります。研究が始まる前に、すべての予測因子が効果を持っていると信じる十分な理由がある場合、完全なモデルが自然な選択です。単なる疑いについていくつかの予測因子を含めた場合、おそらく探索的研究を行ったでしょう。

「重要でない」変数、つまり結果変数の分散をあまり説明しない変数は、サンプルサイズに対して予測子が多すぎる(オーバーフィッティング)か、予測子が非常に多い場合にのみ、データに過度の影響を及ぼします。相関(共線)。理想的には、探索的調査を実行することによってこれらの状況を回避します。

過剰適合/不安定なモデルの問題をチェックする1つの方法は、メインモデルの「重要な」項のみを含む「縮小モデル」を探索することです。重要なことに、この簡約されたモデル分析は、解釈を支援する事後制御分析と呼ばれるべきです。結論は、事前に指定されたモデルにのみ基づいている必要があります。


おかげで、これは非常に便利です。最後の点に関して、完全なモデルとこの縮小モデル(「重要な」用語のみを含む)をいったんフィッティングしたら、比較の基準は何ですか?
Tilen

私の現実(生物学)では、これらの2つの点の一種の組み合わせがしばしばあるということです。私たちはしばしば自然界の関係を推測しようとしていますが、同時に(探索的な方法ではありますが)予測できるようにしようとしています。
Tilen

最初の質問について:比較とはどういう意味ですか?上記のように、すべての推論は事前に指定されたモデルに基づいている必要があります。2番目の質問について:探索と推論の混合は「推測」とも呼ばれ、信頼性の低い結果に導きます。すべてはあなたの目的に依存します。探索したいか、推論したいか、予測したいかを自分で明確にする必要があります。
mzunhammer 2017年

「過剰適合/不安定なモデルの問題をチェックする1つの方法は、メインモデルからの「重要な」用語のみを含む「縮小モデル」を探索することです。」では、この縮小モデルをどのように探索しますか?どういうわけかそれを完全版と比較するつもりだと思いました(だから比較を書きました)。2番目の点に関しては、関係の探索とこれらの関係についての推論の違いを完全に理解しているとは思いません...
Tilen

縮小モデルの作成は、探索的なステップです。メイン分析で有意であると思われる因子があるかどうかを確認する必要がありますが、縮小モデルではそうではありません。これが発生した場合は、その理由を確認する必要があります。探索的研究と推論的研究について:上記の参考文献をご覧ください。
mzunhammer 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.