タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

2
混合モデルでグループをランダムまたは固定として扱う場合の勾配推定値の大きな不一致
いくつかのモデルパラメーターがいくつかのグループ化因子にわたってランダムに変化すると考えられる場合、ランダム効果(または混合効果)モデルを使用することを理解しています。私は、応答がグループ化因子全体で正規化されて(完全ではないがかなり近い)中心に置かれているが、独立変数xはいかなる方法でも調整されていないモデルに適合することを望んでいます。これにより、次のテスト(作成されたデータを使用)に導かれ、実際に効果があるかどうかを確認しました。ランダムインターセプト(で定義されたグループ間)を使用した1つの混合効果モデルと、固定効果予測子として因子fを使用しfた2つ目の固定効果モデルを実行しました。lmer混合効果モデルと基本関数にRパッケージを使用しましたlm()固定効果モデル用。以下はデータと結果です。 yグループに関係なく、0付近で変化することに注意してください。そして、それxはyグループ内で一貫して変化しますが、y > data y x f 1 -0.5 2 1 2 0.0 3 1 3 0.5 4 1 4 -0.6 -4 2 5 0.0 -3 2 6 0.6 -2 2 7 -0.2 13 3 8 0.1 14 3 9 0.4 15 3 10 -0.5 -15 4 11 -0.1 -14 …

3
lmerの分散共分散行列
混合モデルの利点の1つは、データの分散共分散行列(化合物の対称性、自己回帰、非構造化など)をlmer指定できることです。ただし、Rの関数ではこの行列を簡単に指定できません。lmerデフォルトでどの構造が使用されているのか、それを簡単に指定する方法がない理由を誰もが知っていますか?

1
混合効果モデルの推定値の標準誤差はどのように計算する必要がありますか?
特に、線形混合効果モデルの固定効果の標準誤差をどのように計算する必要がありますか(頻度主義的な意味で)? Laird and Ware [1982]で提示されているような典型的な推定値()がSEに与えるとされました推定された分散成分は真の値として扱われるため、サイズが過小評価されます。Var(β^)=(X′VX)−1Var(β^)=(X′VX)−1{\rm Var}(\hat\beta)=(X'VX)^{-1} R のパッケージ内のlmeおよびsummary関数によって生成されるSE nlmeは、上記の分散共分散行列の対角の平方根に単純に等しくないことに気付きました。それらはどのように計算されますか? また、ベイジアンは分散成分の推定に逆ガンマ事前分布を使用するという印象を受けています。これらは(正しい設定で)と同じ結果をもたらしlmeますか?

3
線形混合モデルの落とし穴
線形混合効果モデルを使用する主な落とし穴は何ですか?モデルの適切性を評価する際にテスト/注意する最も重要なことは何ですか?同じデータセットのモデルを比較する場合、探すべき最も重要なことは何ですか?

5
予測にlmerを使用する
こんにちは私は、マルチレベル/混合モデルの自然な候補のように聞こえる2つの問題を抱えています。より簡単な、導入として試してみたいものは次のとおりです。データはフォームの多くの行のように見えます x y innergroup outergroup ここで、xはy(別の数値変数)を回帰する数値共変量であり、各yは内部グループに属し、各内部グループは外部グループにネストされます(つまり、特定の内部グループのすべてのyは同じ外部グループに属します) 。残念ながら、内部グループには多くのレベル(数千)があり、各レベルにはyの観測値が比較的少ないため、この種のモデルが適切であると考えました。私の質問は この種のマルチレベルの数式を作成するにはどうすればよいですか? いったんlmerフィットモデル、どのようにして、それから予測するのでしょうか?いくつかの簡単なおもちゃの例に適合しましたが、predict()関数は見つかりませんでした。ほとんどの人は、この種の手法での予測よりも推論に興味があるようです。数百万の行があるため、計算が問題になる可能性がありますが、必要に応じていつでも削減できます。 しばらくは2番目の操作を行う必要はありませんが、考えてみて、遊んでみてください。以前と同様のデータがありますが、xがなく、yは形式の二項変数です。yは、内部グループ内であっても、多くの過剰分散を示します。nのほとんどは2または3(またはそれ以下)であるため、各y iの成功率の推定値を導出するには、ベータ二項収縮推定量(α + k i)/(α + β + n i)、ここで(n,n−k)(n,n−k)(n,n-k)nnnyiyiy_i(α+ki)/(α+β+ni)(α+ki)/(α+β+ni)(\alpha+k_i)/(\alpha+\beta+n_i)および βは、MLEによって各内部グループに対して個別に推定されます。これはある程度適切ですが、データのスパース性は依然として私を悩ませているので、利用可能なすべてのデータを使用したいと思います。1つの観点からは、この問題は共変量がないためより簡単ですが、他の観点からは、二項の性質によりそれはより困難になります。高い(または低い)レベルのガイダンスはありますか?αα\alphaββ\beta

2
REMLまたはMLは、異なる固定効果を持つ2つの混合効果モデルを比較しますが、同じランダム効果を持ちますか?
背景: 注:テキストの下にデータセットとRコードが含まれています AICを使用して、Rのlme4パッケージを使用して生成された2つの混合効果モデルを比較します。各モデルには、1つの固定効果と1つのランダム効果があります。固定効果はモデル間で異なりますが、ランダム効果はモデル間で同じままです。REML = Tを使用すると、model2のAICスコアが低くなりますが、REML = Fを使用すると、model1のAICスコアが低くなります。 MLの使用のサポート: ズール等。(2009; PAGE 122)「ネストされた固定効果(ただし、同じランダム構造)を持つモデルを比較するには、REMLではなくML推定を使用する必要がある」ことを示唆しています。これは、ランダム効果は両方のモデルで同じですが、固定効果は異なるため、MLを使用する必要があることを示しています。[Zuur et al。2009.エコロジーにおける混合効果モデルと拡張機能とR.スプリンガー。] REMLの使用のサポート: ただし、MLを使用すると、ランダム効果に関連付けられた残差分散は2つのモデル間で異なります(model1 = 136.3; model2 = 112.9)が、REMLを使用するとモデル間で同じです(model1 = model2 = 151.5)。これは、ランダムな残差分散が同じランダム変数を持つモデル間で同じままになるように、代わりにREMLを使用する必要があることを意味します。 質問: 固定効果が変化し、ランダム効果が同じままであるモデルの比較に、MLよりもREMLを使用する方が理にかなっていますか?そうでない場合は、理由を説明したり、詳細を説明している他の文献を教えてください。 # Model2 "wins" if REML=T: REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T) REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T) AIC(REMLmodel1,REMLmodel2) …

2
混合効果モデルにおける説明された分散の割合
これが以前に尋ねられたかどうかはわかりませんが、それについては何も見つかりません。私の質問は、混合効果モデルの固定因子とランダム因子のそれぞれによって説明される分散の割合を取得する方法を学ぶための良い参考資料を提供できるかどうかです。

3
線形混合モデルの説明図は何でしょうか?
あなたがあなたの統計学部の図書館にいて、フロントページに次の絵がある本に出会ったとしましょう。 おそらくこれは線形回帰に関する本だと思うでしょう。 線形混合モデルについて考えさせる画像は何でしょうか?

2
コンピューターベースの実験/シミュレーションにおける残差の独立性?
古科学で使用されている特定のタイプのモデルに適合するさまざまな方法のコンピューターベースの評価を実施しました。大規模なトレーニングセットがあるため、テストセットをランダムに(階層化されたランダムサンプリングで)設定しました。トレーニングセットサンプルに異なる方法を適合させ、結果モデルを使用して、テストセットサンプルの応答を予測し、テストセット内のサンプルのRMSEPを計算しました。これは単一の実行です。mmmmmm その後、新しいテストセットをランダムにサンプリングして異なるトレーニングセットを選択するたびに、このプロセスを何度も繰り返しました。 これを行った後、メソッドのいずれかがRMSEPのパフォーマンスを改善するか、悪化させるかを調査したいと思います。また、ペアワイズ法の複数の比較を行いたいです。mmm 私のアプローチは、線形混合効果(LME)モデルをRunの単一のランダム効果に適合させることでした。私は使用lmer()からlme4のからの私のモデルや機能に合わせてパッケージmultcompの多重比較を行うためのパッケージ。私のモデルは本質的に lmer(RMSEP ~ method + (1 | Run), data = FOO) ここmethodで、テストセットのモデル予測を生成するために使用されたメソッドを示す要因であり、「実験」のRun特定の実行ごとのインジケータです。 私の質問は、LMEの残差に関するものです。実行の単一のランダム効果を考えると、ランダム効果がもたらす誘導相関に基づいて、その実行のRMSEP値はある程度相関しているが、実行間で無相関であると想定しています。 この実行間の独立性の仮定は有効ですか?そうでない場合は、LMEモデルでこれを説明する方法がありますか、または質問に答えるために別のタイプの静的分析を採用する必要がありますか?

3
Rのゼロ膨張負の二項混合効果モデル
Rでゼロ膨張した負の二項混合効果モデル推定を提供するようなパッケージはありますか? ということは: パッケージpsclの関数zeroinflのように、ゼロインフレの二項モデルを指定できるゼロインフレ: zeroinfl(y〜X | Z、dist = "negbin") ここで、Zはゼロインフレモデルの式です。 モデルのカウント部分の負の二項分布。 パッケージlme4の関数lmerと同様に指定されたランダム効果。 glmmADMBはそれをすべて実行できることを理解していますが、ゼロインフレーションの式を指定することはできません(これは単なる切片です。つまり、Zは1になります)。しかし、それをすべて実行できる他のパッケージはありますか? あなたの助けにとても感謝します!

1
反復測定のための不均衡な混合効果分散分析
手術中に2種類の治療を受けた患者のデータがあります。心拍数への影響を分析する必要があります。心拍数の測定は15分ごとに行われます。 患者ごとに手術の長さが異なる場合があるため、各患者は7〜10の心拍数を測定できます。したがって、不均衡な設計を使用する必要があります。Rを使用して分析を行っています。また、ezパッケージを使用して、混合測定ANOVAを繰り返し測定しています。しかし、私は不均衡なデータを分析する方法を知りません。誰でも助けることができますか? データの分析方法に関する提案も歓迎します。 更新: 提案されたように、lmer関数を使用してデータをフィッティングし、最適なモデルは次のとおりであることがわかりました。 heart.rate~ time + treatment + (1|id) + (0+time|id) + (0+treatment|time) 結果は次のとおりです。 Random effects: Groups Name Variance Std.Dev. Corr id time 0.00037139 0.019271 id (Intercept) 9.77814104 3.127002 time treat0 0.09981062 0.315928 treat1 1.82667634 1.351546 -0.504 Residual 2.70163305 1.643665 Number of obs: 378, groups: subj, 60; time, …

1
Rの混合モデル式でのランダム効果の(1 | id)などのウィルキンソンスタイル表記の起源
次のようなRのモデル式 y ~ x + a*b + c:d は、いわゆるウィルキンソン表記法に基づいています:Wilkinson and Rogers 1973、Symbolic Description of Factorial Models for Variance Analysis。 このホワイトペーパーでは、混合モデル(当時は存在しなかった可能性がある)の表記については説明しませんでした。それでlme4、Rで使用される混合モデルの式とRの関連パッケージはどこでしたか y ~ x + a*b + c:d + (1|school) + (a*b||town) から来る?初めて紹介したのはいつですか?彼らのために「ウィルキンソン記法」などの合意された用語はありますか?具体的には次のような用語を参照しています (model formula | grouping variable) (model formula || grouping variable)

1
lmer()モデルの変量効果の分散を理解する
lmer()モデルの出力を理解できません。これは、さまざまな状態インターセプト/状態ランダム効果を持つ結果変数(サポート)の単純なモデルです。 mlm1 <- lmer(Support ~ (1 | State)) 結果は次のsummary(mlm1)とおりです。 Linear mixed model fit by REML Formula: Support ~ (1 | State) AIC BIC logLik deviance REMLdev 12088 12107 -6041 12076 12082 Random effects: Groups Name Variance Std.Dev. State (Intercept) 0.0063695 0.079809 Residual 1.1114756 1.054265 Number of obs: 4097, groups: State, …

1
クラスター化されたデータの適切なブートストラップ手法?
強力なクラスタリングが存在するデータで使用する適切なブートストラップ手法に関する質問があります。 私は、最新の請求データに基づいて現在のベースラインモデルをスコアリングすることにより、保険請求データの多変量混合効果予測モデルを評価するタスクを担当しました95パーセンタイル)。モデルの有効性を評価するために、感度、特異性、および正の予測値(PPV)が使用されます。 ブートストラップは、感度、特異性、PPVの割合の信頼区間を構築する正しい方法のようです。残念なことに、素朴なブートストラップは、請求データが1)ケア提供者によって相関付けられていること、2)ケアのエピソードの数か月前に頻繁に訪問するケアのエピソードにグループ化されているため、適切ではありません(そのため、自己相関が存在します)。ムービングブロックブートストラップテクニックのバリエーションはここで適切でしょうか? または、3段階のブートストラップ手順が機能する可能性があります:1)データ内の個別のプロバイダーからの置換のサンプル、2)選択したプロバイダーによる個別のケアエピソードの置換のサンプル、3)各内の個別のクレームからの置換のサンプル選択したエピソード。 ご提案ありがとうございます!

1
混合サイトとマルチサイト研究のプーリング標準エラー-混合モデルの方が効率的である理由
いくつかのサイトからの「壊れた棒」の毎月の症例数からなるデータセットを持っています。私は2つの異なる技術から単一の要約推定値を取得しようとしています: 手法1:インジケーター変数0/1のポアソンGLMで「壊れたスティック」を取り付け、時間とtime ^ 2変数を使用して時間の傾向を制御します。この0/1インジケーター変数の推定値とSEは、モーメント法のかなりまっすぐな上下方法を使用して、またはRのtlniseパッケージを使用して「ベイジアン」推定値を取得してプールされます。これは、PengとDominiciが大気汚染データで行うことと似ていますが、サイトが少なくなります(1ダース)。 手法2:時間の傾向に対するサイト固有の制御の一部を放棄し、線形混合モデルを使用します。特に: lmer(cases ~ indicator + (1+month+I(month^2) + offset(log(p)), family="poisson", data=data) 私の質問には、これらの推定から生じる標準誤差が含まれます。手法1の標準誤差は、実際には月単位ではなく週単位の時間セットを使用しているため、精度が向上しますが、モーメント法の推定では〜0.206、tlniseでは〜0.306の標準誤差があります。 lmerメソッドは、〜0.09の標準エラーを提供します。効果の推定値はかなり近いため、混合モデルが非常に効率的である限り、異なる要約推定値に焦点を合わせているだけではないようです。 それは期待に値することですか?もしそうなら、なぜ混合モデルはそれほど効率的ですか?これは一般的な現象ですか、それともこのモデルの特定の結果ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.