lmerモデルに使用する多重比較方法：lsmeansまたはglht？

1つの固定効果（条件）と2つのランダム効果（被験者内のデザインとペアによる参加者）を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました：exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。

次に、固定効果（条件）のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。

私が見たものから、人々は使用することを提案しました

1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。

condition     lsmean         SE    df  lower.CL  upper.CL
 Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089
 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443
 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552

Confidence level used: 0.95 

$contrasts
 contrast                   estimate         SE    df t.ratio p.value
 Condition1 - Condition2 -0.04893538 0.03813262 62.07  -1.283  0.4099
 Condition1 - Condition3 -0.10424628 0.03813262 62.07  -2.734  0.0219
 Condition2 - Condition3 -0.05531090 0.03813262 62.07  -1.450  0.3217

P value adjustment: tukey method for comparing a family of 3 estimates

2.multcomp 2つの異なる方法でパッケージ-使用してmcp glht(exp.model,mcp(condition="Tukey"))、その結果

     Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts


Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error z value Pr(>|z|)  
Condition2 - Condition1 == 0  0.04894    0.03749   1.305    0.392  
Condition3 - Condition1 == 0  0.10425    0.03749   2.781    0.015 *
Condition3 - Condition2 == 0  0.05531    0.03749   1.475    0.303  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)

そして、使用lsm glht(exp.model,lsm(pairwise~condition))中の得られました

Note: df set to 62

     Simultaneous Tests for General Linear Hypotheses

Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error t value Pr(>|t|)  
Condition1 - Condition2 == 0 -0.04894    0.03749  -1.305   0.3977  
Condition1 - Condition3 == 0 -0.10425    0.03749  -2.781   0.0195 *
Condition2 - Condition3 == 0 -0.05531    0.03749  -1.475   0.3098  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)

ご覧のとおり、メソッドは異なる結果をもたらします。Rと統計情報を扱うのはこれが初めてなので、何かがおかしいかもしれませんが、どこがわからないでしょう。私の質問は：

提示された方法の違いは何ですか？関連する質問への回答で、それは自由度に関するものだと読みました（lsmeansvs. glht）。 どのタイプを使用するか、つまり、方法1がこのタイプのデータセット/モデルなどに適している場合、いくつかのルールや推奨事項はありますか？ どの結果を報告する必要がありますか？よく知らなくても、おそらく安全にプレイするために得た最高のp値を報告するだけですが、もっと良い理由があるといいでしょう。ありがとう

r repeated-measures multiple-comparisons post-hoc lsmeans bayesian posterior marginal integral anova time-series regularization machine-learning pca computational-statistics references inference regression cross-validation python random-forest chi-squared spearman-rho r machine-learning confidence-interval bagging clustering feature-selection model-selection bic hypothesis-testing kurtosis r regression residuals terminology

— schvaba986
ソース

完全な答えではありません...

glht(myfit, mcp(myfactor="Tukey"))他の2つの方法との違いは、この方法では「z」統計（正規分布）が使用されるのに対して、他の方法では「t」統計（学生分布）が使用されることです。「z」統計は、無限の自由度を持つ「t」統計と同じです。この方法は漸近的な方法であり、他の方法よりも小さいp値と短い信頼区間を提供します。データセットが小さい場合、p値が小さすぎる可能性があり、信頼区間が短すぎる可能性があります。

実行するとlsmeans(myfit, pairwise~myfactor)、次のメッセージが表示されます。

Loading required namespace: pbkrtest

つまり、lsmeans（lmerモデルの場合）pbkrtest"t"統計の自由度に対してKenward＆Rogersメソッドを実装するパッケージを使用します。この方法は、漸近的なものよりも優れたp値と信頼区間を提供することを目的としています（自由度が大きい場合、違いはありません）。

さて、違いについてlsmeans(myfit, pairwise~myfactor)$contrastsとglht(myfit, lsm(pairwise~factor)、私はいくつかのテストを行っていると私の観察は以下のものです：

lsmlsmeansパッケージとパッケージ間のインターフェースですmultcomp（を参照?lsm）
バランスの取れたデザインの場合、結果に違いはありません
不均衡な設計の場合、結果（標準誤差とt比）にわずかな違いが見られました。

残念ながら、これらの違いの原因はわかりません。線形仮説行列と自由度を取得するだけのlsm呼び出しのように見えますが、標準誤差の計算には別の方法を使用します。lsmeanslsmeans

— ステファン・ローラン
ソース

詳細な対応ありがとうございます！検定統計量の違いを完全に見落としていました...値が小さすぎ、CIが漸近法に対して狭すぎる可能性があることに言及しています。私のデータセットは最大30人の参加者で構成されているので、t統計に固執すると思います。Kenward＆Rogersの方法がより良いp値につながると言うとき、より正確か、それとも小さいことを意味しますか？違いはdfとSEの計算方法の違いによるものであり、あなたが正しく理解していれば、私のモデルでそれらの1つを誤って使用したことによるものではありません。ここで「最良の」方法を選択する方法はありますか？

— schvaba986

（私はlsmeansパッケージ開発者です）pbkrtestパッケージをlsmeans使用します。これは、（1）Kenward-Rogers df計算と（2）推定値のバイアスが低減された調整された共分散行列を提供します。を最初に設定した場合lsm.options(disable.pbkrtest=TRUE)、lsmeanswith の呼び出しは、多変量t分布の両方のパッケージで使用されるランダム化アルゴリズムによるわずかな違いを除いてadjust="mvt"、と同じ結果にglhtなります。

— -rvl

ただし、バイアス調整とdfがない場合、漸近（z）値は本質的に無限のdfを想定しているため、pbkrtestを無効にせずに「mvt」調整をお勧めします。

— rvl

ところで、summary方法はglht、種々の降圧デフォルトワンステップ以外の方法を試験（同時CIS）多重度調整を可能にします。まったく異なる点で、複数の要因がある場合lsm、通常のタイプの比較を非常に簡単に作成できますが、まったくmcpできません。

— rvl