混合モデル(変量効果としての主題)と単純な線形モデル(固定効果としての主題)の比較


10

大量のデータの分析を終えています。作業の最初の部分で使用された線形モデルを取得し、線形混合モデル(LME)を使用して再適合させたいと思います。LMEは非常に似ていますが、モデルで使用される変数の1つが変量効果として使用される点が異なります。このデータは、少数の被験者(〜10)の多くの観測(> 1000)から得られ、被験者の効果のモデリングはランダム効果(これはシフトしたい変数です)として行う方がよいことを知っています。Rコードは次のようになります。

my_modelB <- lm(formula = A ~ B + C + D)    
lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML')

すべてが正常に実行され、結果は非常に似ています。RLRsimやAIC / BICのようなものを使用して、これら2つのモデルを比較し、どちらが最も適切であるかを判断できれば、すばらしいと思います。LMEの方が適切なモデルだと思いますが、同僚が「より良い」ものを選択する簡単にアクセスできる方法がないため、LMEを報告したくありません。助言がありますか?

回答:


6

コメントとして投稿するには長すぎるため、@ ocramの回答にこれを追加します。ネストされたモデル設定でのレベルのランダム切片のA ~ B + C統計的有意性を評価できるように、私はあなたのヌルモデルとして扱いDます。ocramが指摘したように、場合、規則性の条件に違反し、尤度比検定統計(LRT)は必ずしも漸近的に分布したはありません。私が教えた解決策は、LRT(そのブートストラップ分布ははない可能性が高い)をパラメトリックにブートストラップし、次のようにブートストラップp値を計算することでした。H0:σ2=0χ2χ2

library(lme4)
my_modelB <- lm(formula = A ~ B + C)
lme_model <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
lrt.observed <- as.numeric(2*(logLik(lme_model) - logLik(my_modelB)))
nsim <- 999
lrt.sim <- numeric(nsim)
for (i in 1:nsim) {
    y <- unlist(simulate(mymodlB))
    nullmod <- lm(y ~ B + C)
    altmod <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
    lrt.sim[i] <- as.numeric(2*(logLik(altmod) - logLik(nullmod)))
}
mean(lrt.sim > lrt.observed) #pvalue

観測されたLRTがp値よりも極端なブートストラップLRTの割合。


回答していただきありがとうございます。また、検定統計にカイ二乗分布の代わりにカイ二乗の混合を使用する場合もあります。
ocram 2011年

変数をランダムとして扱うか、分析とは別に固定するかを決定する際のコメントに対する@ocram +1。@MudPhud PIが問題を理解せず、p値を主張する場合は、変量効果のテストの結果(とにかく記事に含めます)を彼に示すだけかもしれません。
ロックオフ2011年

コードをありがとう。私はそれを実行したときの結果は、ブートストラップLRTsのいずれでもない、私はランダム効果やでスローでも元の変数なしのLMに固執することができ、この手段はので、観測されたよりも大きいです。
MudPhud

@MudPhud:エラーが発生しましたか?入力lrt.simして、すべてがゼロでないことを確認してください。その場合、最も考えられる原因は、パッケージがlme4インストールされていないことです。
ロックオフ2011年

それらは0ではなく、観測値(63.95)と比較して非常に小さい(〜1e-6)。
MudPhud 2011年

2

lme関数を使用するときに、どのモデルが適合しているかは完全にはわかりません。(ランダム効果はゼロ平均の正規分布に従うと思われますか?)ただし、ランダム効果の分散がゼロの場合、線形モデルは混合モデルの特殊なケースです。いくつかの技術的な問題が存在しますが(は分散のパラメーター空間の境界にあるため)、 vs ... をテストすることは可能です。0H0:variance=0H1:variance>0

編集

混乱を避けるために:上記のテストは、変量効果が有意であるかどうかを決定するために使用されることがありますが、固定効果に変換する必要があるかどうかは決定しません。


問題は、変数を混合効果またはランダム効果のどちらとしてモデル化する必要があるかを決定するためのテストがあるかどうかです。それ以外の場合は、説明したテストを実行してから、カイ二乗距離でテストできます(適切なテストが何かはわかりません)。
MudPhud 2011年

2
@MudPhud:変数を固定効果または変量効果としてモデル化することは、研究が計画されている場合、分析の前に実際に決定する必要があります。特に、結論の範囲によって異なります。ランダム効果により、より一般化が可能になります。また、技術的な問題を回避することもできます。たとえば、多くのレベルを持つカテゴリカル変数が固定変数と見なされる場合にそうであるように、パラメーターの数が増えると、漸近性が崩れる可能性があります。
ocram 2011年

私は同意しますが、これを私のPIに説明しようとしたとき、彼は振り向いて、何らかのp値を求めました。私はこの分析を原稿に含めたいのですが、もっと具体的な正当化がなければ彼はそれを入れません。
MudPhud 2011年

1
@MudPhud:私の知る限りでは、そのような決定に対するp値はありません。選択した特定のレベルの効果に関心が集中する場合、それは固定されていると見なされます。利用可能な因子レベルがより大きな母集団からの無作為標本として見られ、その推論がより大きな母集団に対して望まれる場合、効果は無作為でなければなりません。
ocram 2011年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.