モデルの平均化結果をRに解釈する

11

Rでのモデルの平均化を使用して、いくつかのデータの分析から何を報告するかを理解および把握しようとしています。

次のスクリプトを使用して、特定の変数に対する測定方法の影響を分析しています。これはデータセットです。https：//www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv？dl = 0

装着するモデル：

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

浚渫フルモデル

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

すべてのモデルの要約情報を取得してパラメーター推定値を取得する

summary(model.avg(d))

すべてのモデルを平均化（フルモデル平均）することも、それらのサブセットのみ（条件付き平均化）にすることもできます。さて、私は知りたいのですが、完全平均または条件付き平均を使用して推論を行う方が良い場合はいつですか。科学論文についてこれをすべて報告する必要がありますか？モデルの平均化状況で正確にZ値と関連するpはどういう意味ですか？

質問を視覚化しやすくするため。これが結果表です

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

r model-averaging

— アグスカマチョ
ソース

5

グルーバー等を参照。2011、「生態学と進化におけるマルチモデル推論：課題と解決策」Evolutionary Biology 24：699-711。

完全なデータと条件付きデータのどちらを使用するかは、目標によって異なります。私の分野では、AICCなどの基準を使用して、どのモデルが最もサポートされているかを判別し、それらを条件付きサブセットとして使用します。その後、この情報が報告されます。たとえば、最初の4つのモデルはすべて互いの2 AICユニット内にあるため、すべてがサブセットに含まれます。他の方法ははるかに進んでいるため（AICが高い）、それらからの情報を含めると、実際にベータ推定の質が低下します。

— オーディエ
ソース

2

ただし、提案された例でも、4つの「最良の」モデルのうちのおそらく2つに現れるいくつかの用語があります。これらの2つの係数値の平均、または2つのモデルの2つの値と2つのゼロ値の、それらが表示されない場合の平均をとりますか？

— user2390246 2016年

5

完全平均と条件付き平均の正確な違いについての前提は間違っていると思います。1つはゼロを含む平均（フル）で、もう1つはゼロを含まない（条件付き）です。model.avg（）コマンドのヘルプファイルから：

注意

'サブセット'（または '条件付き'）の平均は、パラメーターが表示されるモデルの平均のみです。別の方法として、「完全」平均は、変数がすべてのモデルに含まれていると想定しますが、一部のモデルでは、対応する係数（およびそのそれぞれの分散）はゼロに設定されます。「サブセット平均」とは異なり、ゼロから値を偏らせる傾向はありません。「完全」平均は収縮推定の一種であり、応答との関係が弱い変数の場合、「サブセット」推定よりも小さくなります。

（デルタAICなどに基づく）モデルのサブセットのみを使用する場合は、model.avg（）でサブセット引数を使用します。含まれているモデルのいくつかに、他のモデルが持っているいくつかの変数が欠落している限り、条件付きで完全な推定が得られます。

— ジョー・サップ
ソース

はい。同意する。それが正しい解釈です。

— ecologist1234