予測にlmerを使用する


18

こんにちは私は、マルチレベル/混合モデルの自然な候補のように聞こえる2つの問題を抱えています。より簡単な、導入として試してみたいものは次のとおりです。データはフォームの多くの行のように見えます

x y innergroup outergroup

ここで、xはy(別の数値変数)を回帰する数値共変量であり、各yは内部グループに属し、各内部グループは外部グループにネストされます(つまり、特定の内部グループのすべてのyは同じ外部グループに属します) 。残念ながら、内部グループには多くのレベル(数千)があり、各レベルにはyの観測値が比較的少ないため、この種のモデルが適切であると考えました。私の質問は

  1. この種のマルチレベルの数式を作成するにはどうすればよいですか?

  2. いったんlmerフィットモデル、どのようにして、それから予測するのでしょうか?いくつかの簡単なおもちゃの例に適合しましたが、predict()関数は見つかりませんでした。ほとんどの人は、この種の手法での予測よりも推論に興味があるようです。数百万の行があるため、計算が問題になる可能性がありますが、必要に応じていつでも削減できます。

しばらくは2番目の操作を行う必要はありませんが、考えてみて、遊んでみてください。以前と同様のデータがありますが、xがなく、yは形式の二項変数です。yは、内部グループ内であっても、多くの過剰分散を示します。nのほとんどは2または3(またはそれ以下)であるため、各y iの成功率の推定値を導出するには、ベータ二項収縮推定量α + k i/α + β + n i、ここで(n,nk)nyi(α+ki)/(α+β+ni)および βは、MLEによって各内部グループに対して個別に推定されます。これはある程度適切ですが、データのスパース性は依然として私を悩ませているので、利用可能なすべてのデータを使用したいと思います。1つの観点からは、この問題は共変量がないためより簡単ですが、他の観点からは、二項の性質によりそれはより困難になります。高い(または低い)レベルのガイダンスはありますか?αβ


収縮式に挿入した括弧が意図した場所にあることを確認してください。
whuber

1
質問の2番目の部分(バイナリ変数を使用)は別の質問ではありませんか?
chl

回答:


17

R式を使用した因子関係の表現は、ウィルキンソンの表記法に従います。「*」は交差と「/」の入れ子を示しますが、混合効果モデル、またはより一般的にはランダム効果の式の処理方法にはいくつかの特殊性があります。たとえば、2つの交差したランダム効果はとして表される場合があり(1|x1)+(1|x2)ます。私はあなたの説明をネストの例として解釈しました、クラスが学校でネストされているように(州などでネストされている)、基本的な式lmerは次のようになります(特に明記しない限りgaussian、デフォルトで家族が使用されます):

y ~ x + (1|A:B) + (1|A)

ここで、AとBはそれぞれ内部因子と外部因子に対応します。BはA内にネストされ、両方がランダムな要因として扱われます。古いnlmeパッケージでは、これはのようなものに対応しますlme(y ~ x, random=~ 1 | A/B)。Aを固定因子と見なす場合、式はである必要がありますy ~ x + A + (1|A:B)

しかし、D。Batesのlme4パッケージの仕様をより正確に確認する価値があります。たとえば、近日公開予定の教科書lme4:Rを使用した混合効果モデリング、または同じWebページで利用可能な多数の配布資料です。特に、Rのlme4パッケージである線形混合効果モデルのフィッティングには、このような入れ子関係の例があります。John Maindonaldのチュートリアルでは、Rのlme4パッケージを使用した、混合モデル分析の解剖学という素晴らしい概要も提供しています。最後に、lme4の実装に関するRビネットのセクション3には、ネスト構造の分析の例が含まれています。

lme4にpredict()機能はありません(この機能は現在存在して、以下のコメントを参照)、そしてあなた自身が固定(参照推定使用して、個々の予測値を計算する必要がある?fixef)とランダム(参照?ranef)の影響が、上でも、このスレッドを参照してくださいlme4で関数を予測するの欠如mcmcsamp()関数を使用して事後分布からサンプルを生成することもできます。ただし、衝突する場合があります。最新の情報については、sig-meメーリングリストを参照してください。


3
更新するには:lme4現在、predict
バー

ここで利用可能になりましpredict.merModのドキュメント:rdocumentation.org/packages/lme4/versions/1.1-12/topics/...
DirtStats

10

EZのパッケージには、予測が唯一の固定効果に基づいていますlmerモデルからの予測を取得ezPredict()関数が含まれています。これは、glmm wikiで詳しく説明されているアプローチの単なるラッパーです。


5

Zeligの "logit.mixed"関数を使用します。これは、lime4のラッパーであり、予測とシミュレーションを行うのに非常に便利です。


zeligにlogit.mixedのpredcit()メソッドはないようです。
nassimhddd13年

3

lme4の開発バージョンには、予測機能が組み込まれています(predict.merMod)。これは、上で見つけることができますhttps://github.com/lme4/lme4/

「lme4 r-forgeリポジトリからほぼ最新の開発バイナリ」をインストールするコードは、上記のページにあります。

install.packages("lme4", repos=c("http://lme4.r-forge.r-project.org/repos", getOption("repos")["CRAN"]))

1
これはもはや開発バージョンでpredictはなく、数年前から利用可能であることに注意してください。
ベンボルカー

1

Stephen Raudenbushには、「多くの小グループ」に関するマルチレベル分析ハンドブックに本の章があります。yに対するxの効果のみに関心があり、より高いレベルの効果に関心がない場合、彼の提案は、固定効果モデル(つまり、すべての可能なより高いレベルのグループ化のダミー変数)を推定することです。

それが予測にどのように適用できるかはわかりませんが、彼が書いていることのいくつかは、あなたが達成しようとしているものに適用できると思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.