GLMの応答スケールでモデル平均予測を計算するには、「正しい」のはなぜですか?
- リンクスケールでモデル平均予測を計算し、応答スケールに逆変換するか、または
- 予測を応答スケールに逆変換し、モデルの平均を計算します
モデルがGLMの場合、予測は近いものの等しくありません。異なるRパッケージは、両方にオプションを提供します(デフォルトは異なります)。何人かの同僚は、「誰もが#2をしている」ため#1が間違っていると大声で主張しています。私の直感では、#1はすべての線形数学を線形に保つため「#1」が正しいと言います(#2は線形スケールではないものを平均します)。単純なシミュレーションでは、#2のMSEが#1よりも非常に(非常に)わずかに小さいことがわかります。#2が正しい場合、その理由は何ですか?そして、もし#2が正しいなら、なぜ私の理由(線形の数学を線形に保つ)が不十分な推論であるのですか?
編集1:GLMの別の要因のレベルに対する限界平均の計算は、私が上で尋ねている質問と同様の問題です。Russell Lenthは#1(emmeansパッケージ内)の「タイミング」(彼の言葉)を使用してGLMモデルの周辺平均を計算し、彼の議論は私の直感に似ています。
編集2:モデル平均化を使用して、予測(または係数)が「最適な」ネストされたモデルのすべてまたはサブセットの加重平均として推定されるモデル選択の代替を参照しています(参照およびRパッケージを参照) 。
上記の#2を使用したモデル平均予測
モデル平均化のいくつかのベイジアンおよびフリークエンティスト法は次のとおりです。
Hoeting、JA、Madigan、D.、AE、Raftery、およびVolinsky、CT、1999年。ベイジアンモデル平均化:チュートリアル。統計科学、pp.382-401。
Burnham、KPおよびAnderson、DR、2003。モデル選択とマルチモデル推論:実用的な情報理論的アプローチ。スプリンガーサイエンス&ビジネスメディア。
Hansen、BE、2007。最小二乗モデルの平均化。計量経済学、75(4)、pp.1175-1189。
Claeskens、G. and Hjort、NL、2008。モデル選択とモデル平均化。ケンブリッジブックス。
Rパッケージには、BMA、MuMIn、BAS、およびAICcmodavgが含まれますます。(注:これは、より一般的なモデル平均化の知恵についての質問ではありません。)