モデルから項を削除した後の適切な残留自由度


27

この質問に関する議論、特にフランク・ハレルのコメントについて、縮小モデル(つまり、多くの説明変数がテストされ、棄却されたモデル)の分散の推定には、Yeの一般化された自由度を使用する必要があると考えています。ハレル教授は、これが最終モデル(多くの変数が拒否された)からのものよりも、元の「完全な」モデル(すべての変数を含む)の残留自由度にはるかに近いと指摘します。

質問1.縮約モデルからのすべての標準的な要約と統計に適切なアプローチを使用したい場合(ただし、一般化された自由度の完全な実装が不足している場合)、残差分散などの推定における完全なモデル?

質問2.上記が真実で、私がそれをやりたいなら、R設定と同じくらい簡単かもしれません

finalModel$df.residual <- fullModel$df.residual

モデル適合の演習のある時点で、finalModelとfullModelがlm()または同様の関数で作成されました。その後、summary()やconfint()などの関数が目的のdf.residualで動作するように見えますが、誰かが明らかにfinalModelオブジェクトをいじったというエラーメッセージを返します。


8
良い質問。これは、Douglas Batesがlmer出力にp値を含めない理由に関連しています。ここで彼の推論を見てください

2
このような状況で使用される完全なモデルdfを複数回目にしました。(あなたのアプローチはさまざまな状況でたくさん出てきます。それは私が定期的に人々に勧めている論文です。多くの機能が利用できる一般的だが効率的なR関数があればいいと
思い

回答:


3

とにかく、par約にはsomeい科学的トレードオフが伴うという@FrankHarrelの答えに反対しますか?

Doug Batesの理論的根拠に対する@MikeWiezbickiのコメントで提供されているリンクが大好きです。誰かがあなたの分析に同意しない場合、彼らは彼らの方法でそれをすることができます、そして、これはあなたの基本的な仮定について科学的な議論を始める楽しい方法です。p値はあなたの結論を「絶対的な真実」にしません。

モデルにパラメーターを含めるかどうかの決定が、科学的に意味のあるサンプルについてはdfの比較的小さな矛盾である「ピッキングヘア」に帰着する場合、そして正当化する問題を扱っていない場合とにかくより微妙な推論、そしてあなたはあなたのカットオフを満たすのに非常に近いパラメータを持っているので、あなたは透明であり、それについて話す必要があります:それを含めるか、それの有無にかかわらずモデルを分析しますが、決定を明確に議論します最終分析。 n<p


2
+1は、私は今、実際には、私の元の質問は、これらの他の問題与えられていないことが重要であることに同意することが傾いています
ピーター・エリス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.