タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

1
難しいデータセットのモデルは何ですか?(ネスティングの多い数百の時系列)
分析するのに非常に複雑なデータセットがあり、それに対する適切な解決策を見つけることができません。 ここに事があります: 1.生データは本質的に昆虫の歌の録音です。各曲はいくつかのバーストで構成され、各バーストはサブユニットで構成されています。すべての個人が5分間記録されました。バーストの数と記録内でのそれらの位置、およびバーストごとのサブユニットの数は、個人間で非常に異なる場合があります。 2.各サブユニットのキャリア周波数(基本周波数)がわかっているので、それを分析します。 私の問題: 1.バースト内の周波数は明らかに独立していません(かなり安定していますが、サブユニットn-1の周波数はサブユニットnに影響します)。 2.バーストは、録音内でも独立していません。 3.時間とともに周波数が下がるので、それらの独立性はさらに低くなります(個人が歌うのに飽きて、曲の周波数がどんどん低くなります)。落ち込みは直線的なようです。 4.ネスト= 2つの場所AとBに3つの複製された母集団があります。したがって、A1、A2、A3とB1、B2、B3があります。 私がしたいこと: 1. 2つの場所の頻度の違いを特徴付ける(統計的にテストする) 2. 2つの場所の間で落ちる周波数を特徴付けます(それらの1つで速く落ちるかどうかを確認してください)。 どうやってするの: それが私が助けを必要とする理由です:私にはわかりません。私のケースは、通常一緒に見られない問題を組み合わせているようです。私は混合モデル、GAM、ARIMA、ランダム効果と固定効果について読みましたが、それを行うための最良の方法を本当に確信できません。しかし、それをグラフ化すると(頻度〜サブユニット番号n)、2つの場所の違いは非常に明確です。温度(周波数を高くする)など、他の変数も考慮する必要があります。 私は考えました: レプリケート内の個人を入れ子にし、複製を場所(個人/複製/場所)内に入れ子にします。 ランダムな「バースト」効果を使用して、各バースト内の変動を考慮します。 固定された「記録中のバースト位置」効果を使用して、周波数の低下を測定します(実際には線形であることを期待しています)。 正しいでしょうか? このようなシナリオに使用できる特別なタイプのモデルはありますか?

2
混合モデルの相互検証?
私の同僚と私は、Rで一連の線形および非線形混合効果モデルを近似しています。観測された効果が比較的一般化できることを確認できるように、近似モデルで交差検証を実行するように求められます。これは通常は簡単な作業ですが、この場合、データ全体を、共通のレベルを共有しないトレーニング部分とテスト部分(CVの目的)に分割する必要があります。例えば、 トレーニングデータはグループ1、2、3、4に基づく場合があります。次に、適合モデルはグループ5で交差検証されます。 したがって、トレーニングデータで推定されたグループベースのランダム効果はテストデータに適用されないため、これは問題を引き起こします。したがって、モデルをCVすることはできません。 これに対する比較的簡単な解決策はありますか?それとも、この問題に取り組むためのパッケージをまだ誰かが書いていますか?ヒントは大歓迎です! ありがとう!

3
変量効果はカテゴリ変数にのみ適用できますか?
この質問は愚かに聞こえるかもしれませんが... ランダムな効果はカテゴリ変数(個人ID、人口IDなど)にのみ適用できることは正しいです。たとえば、はカテゴリ変数です。xixix_i yiyiy_i〜βxiβxi\beta_{x_i} βxiβxi\beta_{x_i}〜Norm(μ,δ2)Norm(μ,δ2)Norm(\mu, \delta^2) しかし、原則から、ランダム効果は連続変数(高さ、質量など)に適用できませんと言います。ziziz_i yiyiy_i〜α+β⋅ziα+β⋅zi\alpha + \beta \cdot z_{i} それでは、制約できない係数が1つしかないからです。論理的に聞こえるかもしれませんが、なぜそれが統計文献に記載されていないのでしょうか。ありがとう!ββ\beta EDIT:しかし、どのような場合、私制約よう〜?それはランダム効果ですか?しかし、これはに課した制約とは異なります -ここでは変数を制約しますが、前の例では係数を制約しました!それは私にとって大きな混乱のように見えます...とにかく、は既知の値であるため、この制約を置くことはあまり意味がありません。ziziz_iziziz_iNorm(μ,δ2)Norm(μ,δ2)Norm(\mu, \delta^2)βxiβxi\beta_{x_i}ziziz_i

2
ペアの反復測定ANOVAまたは混合モデル?
血圧を測定する2つの方法を検討している臨床試験のデータを分析するように依頼されました。50の被験者からのデータがあり、各方法を使用してそれぞれ2〜57のメジャーがあります。 どのように進めるのが最善かと思います。 明らかに、血圧の測定値がペアになっている(2つの方法が同時に測定されている)ことと、時間変化する共変量(患者ごとに異なる数の観察が行われること)を考慮し、内部と内部の両方を考慮に入れるソリューションが必要です。患者の多様性。 どういうわけかこれを繰り返し測定ANOVAに靴角掛けすることを考えていましたが、混合モデルのアプローチが必要かもしれないと思っています。 役立つアドバイスをいただければ幸いです。 私は完全なR初心者ですが、スキルを開発することに非常に興奮しており、私はスタタで適度な経験を持っているので、いつでもそれに頼ることができます。
9 r  anova  mixed-model  stata 

1
このタイプのブートストラップの名前はありますか?
それぞれが2つの条件で複数回測定された、複数の人間の参加者による実験を考えます。混合効果モデルは、次のように定式化できます(lme4構文を使用)。 fit = lmer( formula = measure ~ (1|participant) + condition ) ここで、このモデルの予測に対してブートストラップされた信頼区間を生成したいとします。簡単で計算効率の高い方法を思いついたと思います。最初に考えたのは私ではないと思いますが、このアプローチを説明している以前の出版物を見つけるのに苦労しています。ここにあります: (上記のように)モデルを適合させ、これを「オリジナルモデル」と呼びます。 元のモデルから予測を取得し、これらを「元の予測」と呼びます 各参加者からの各応答に関連付けられた元のモデルから残差を取得します 残差を再サンプリングし、置換で参加者をサンプリングする ガウス誤差のある線形混合効果モデルを残差に近似し、これを "中間モデル"と呼びます 各条件の暫定モデルから予測を計算し(これらの予測はゼロに非常に近くなります)、これらを「暫定予測」と呼びます 中間予測を元の予測に追加し、結果を「リサンプル予測」と呼びます 手順4から7を何度も繰り返し、CIを計算できる条件ごとにリサンプル予測の分布を生成します。 単純な回帰(つまり、混合モデルではない)のコンテキストで「残差ブートストラップ」手順を見て、残差がリサンプリングの単位としてサンプリングされてから、元のモデルの予測に追加されてから、ブートストラップですが、これは、残差がリサンプリングされない、人々がリサンプリングされる、そしてその後だけに説明するアプローチとはかなり異なるようです暫定モデルは、元のモデルの予測が機能するときに取得されます。この最後の機能には、元のモデルの複雑さに関係なく、暫定モデルが常にガウス線形混合モデルとして適合できるという非常に優れた副次的利点があります。これは、場合によってはかなり高速になる可能性があります。たとえば、最近2項データと3つの予測子変数があり、そのうちの1つが非常に非線形の影響を引き起こすと疑われたため、2項リンク関数を使用した一般化加法混合モデリングを使用する必要がありました。この場合の元のモデルの適合には1時間以上かかりましたが、各反復でのガウスLMMの適合には数秒しかかかりませんでした。 これがすでに既知の手順である場合、私はこれに優先権を主張したくないので、これが以前に説明された可能性のある場所に関する情報を誰かが提供できれば非常に感謝します。(また、このアプローチで明白な問題がある場合は、私に知らせてください!)

2
lmerモデルを正しく指定していますか?
私はGoogleとこのサイトを調べましたが、それでもlme4ライブラリのlmer関数について混乱しています。 複数レベルの構造を持つさまざまな精神科病棟から収集したデータがあります。簡単にするために、レベル2とレベル1の変数を2つ選択しますが、実際にはさらにいくつかあります。 レベル2-WardSize [これは病棟にいる人数]&WAS [これは病棟がどの程度「すてき」かを示す尺度です] どの病棟にいるのかを「病棟」と呼ばれるRに伝えるグループ化変数 レベル1-性別(これは明らかに性別です)&BSITotal [これは症状の重症度の尺度です] 結果はSelfrejectで、これもまたそのように聞こえます。 私はこの式を持っています: help = lmer(formula = Selfreject〜WardSize + WAS + Gender + BSITotal +(1 | Ward)) これは、「各個人が自分の性別と症状の重症度に関連するスコアを持っていること、また、病棟のサイズとそれがいかに「素敵」かという病棟レベルの効果があることを願っています。 これは正しいです?混乱しているのは、最後に与えられた病棟レベルの切片を除いて、Rがレベル1変数とレベル2変数を区別する方法を理解できないことです。 もし誰かがその表記法を説明できれば、私のような馬鹿がそれを理解できるようになればさらに良いでしょう。 どうもありがとう!

3
GLMMの固定効果の計算を高速化するにはどうすればよいですか?
私はシミュレーション研究を行っています。これは、一般化線形混合モデルから取得した推定値(実際には、固定効果の2つの推定値の1つ(GLMMとLMMの1つ)の積)を必要とします。調査を適切に行うには、毎回1000または1500のブートストラップレプリケーションで約1000のシミュレーションが必要です。これには、私のコンピューターでかなりの時間がかかります(数日)。 How can I speed up the computation of these fixed effects? より具体的には、私は3つの方法で繰り返し測定され、変数X、M、およびYを発生させる被験者があります。ここで、XとMは連続で、Yはバイナリです。我々は2つの回帰方程式持っ Yところための基礎となる潜在連続変数であるとIIDされないエラー。 ブートストラップしたい統計はです。したがって、各ブートストラップ複製には、LMMとGLMMのフィッティングが必要です。私のRコードは(lme4を使用)Y * = β 0 + β 1 X + β 2 M + ε 2 * Y α 1 β 2M= α0+ α1バツ+ ϵ1M=α0+α1X+ϵ1M=\alpha_0+\alpha_1X+\epsilon_1 Y∗= β0+ β1バツ+ β2M+ ϵ2Y∗=β0+β1X+β2M+ϵ2Y^*=\beta_0+\beta_1X+\beta_2M+\epsilon_2∗∗^*YYYα1β2α1β2\alpha_1\beta_2 stat=function(dat){ a=fixef(lmer(M~X+(X|person),data=dat))["X"] b=fixef(glmer(Y~X+M+(X+M|person),data=dat,family="binomial"))["M"] return(a*b) } 線形モデルとして近似しただけでもは同じ推定値になるので、時間は節約できますが、では同じトリックが機能しません。β …
9 r  mixed-model 

1
モデル平均化アプローチ—係数推定値とモデル予測の平均化?
IT基準を使用して候補セット内のモデルに重み付けするモデル平均化のアプローチに関する基本的な質問があります。 私がモデル平均化で読んだほとんどのソースは、モデルの重みに基づいてパラメーター係数推定値を平均化することを提唱しています(「自然平均」または「ゼロ平均」法を使用しています)。ただし、特にモデルをネストされていない予測子変数と比較する場合、モデルの重みに基づくパラメーター係数推定値ではなく、各モデルの予測の平均化と重み付けがより簡単で正当なアプローチであるという印象を受けました。 モデル平均化へのどのアプローチが最も正当化されるかについての明確なガイダンスはありますか(加重パラメーター推定値と加重予測の平均化)?また、混合モデルの場合、係数推定値のモデル平均化でさらに複雑になりますか?

1
二項モデル(lme4)の変量効果の推定
ランダムロジットでベルヌーイ試験をシミュレートしていますグループとの間で、私と対応するモデルフィットパッケージ:ロジットθ 〜N(ロジットθ0、12)logitθ∼N(logitθ0,12)\text{logit}\, \theta \sim {\cal N}(\text{logit}\, \theta_0, 1^2)lme4 library(lme4) library(data.table) I <- 30 # number of groups J <- 10 # number of Bernoulli trials within each group logit <- function(p) log(p)-log(1-p) expit <- function(x) exp(x)/(1+exp(x)) theta0 <- 0.7 ddd <- data.table(subject=factor(1:I),logittheta=rnorm(I, logit(theta0)))[, list(result=rbinom(J, 1, expit(logittheta))), by=subject] fit <- glmer(result~(1|subject), …

1
マルチレベル/階層設計で非ランダム因子をランダムとしてモデル化できますか?
厳密にランダムな変数(そのようにモデル化する必要がある)と、階層/マルチレベルモデルの場合にランダムとしてモデル化できると主張する非ランダム変数の違いは、私には不明瞭です。 BatesとBolkerは、ランダムに選択されたサンプルの製品の品質など、真のランダム性の場合のランダム効果を例示します。彼らのlme4仕事はすごいですが、線がランダムとランダムではないところがどこにあるのかはまだはっきりしていません。社会科学での議論は、これをさらに不明瞭にします。マルチレベル/階層モデルと変量効果モデルはで計算上等しいlme4ので、どこに線を引くのでしょうか。 たとえば、私は複数の個人で反復測定のデータセット(ランダムです!)を持っていますが、私は、lme4分散の大部分が社会経済変数(居住地域、人種など)内にあると考えており、その結果を示しています。これらの変数はランダムではありませんが、マルチレベルモデルはこれらをそのまま使用できると主張しています。他の例は、学生の学年の研究から来ています。通常、学生を教師内に、さらには学校内に入れ子にしています。これらの変数はすべて定数です。 マルチレベル(階層)モデルの領域で妥当である場合、非ランダム因子をランダムとしてモデル化できますか?

1
反復測定anovaモデルと混合モデルの同等性:lmerとlme、および複合対称性
aov内部反復測定モデルとlmer混合モデルの間で同等の結果を取得するのに問題があります。 私のデータとスクリプトは次のようになります data=read.csv("https://www.dropbox.com/s/zgle45tpyv5t781/fitness.csv?dl=1") data$id=factor(data$id) data id FITNESS TEST PULSE 1 1 pilates CYCLING 91 2 2 pilates CYCLING 82 3 3 pilates CYCLING 65 4 4 pilates CYCLING 90 5 5 pilates CYCLING 79 6 6 pilates CYCLING 84 7 7 aerobics CYCLING 84 8 8 aerobics CYCLING 77 9 …

1
統計的に有意ではない場合、変量効果をモデルから除外する必要がありますか?
統計的に有意ではない場合でも、変量効果をモデルに含める必要がありますか?私は繰り返し測定実験計画を立てており、各個人はランダムな順序で3つの異なる治療を経験しています。個人と秩序の影響を制御したいのですが、どちらのモデルも統計的に有意ではないようです。それで除外しても大丈夫ですか、それとも含める必要がありますか?

3
線形モデル:2つの異なる測定方法の予測力の比較
私は予測に興味があり、Y異なる2つの測定手法X1とを研究していX2ます。たとえば、テーブルの上に置いた時間を測定するか、バナナの茶色の斑点の数を測定することで、バナナの美味しさを予測したい場合があります。 1つだけを実行することを選択した場合、どちらの測定手法が優れているか知りたい。 Rで線形モデルを作成できます。 m1 = lm(Y ~ X1) m2 = lm(Y ~ X2) ではX1、バナナの美味しさの優れた予測因子であるとしましょうX2。2つのモデルのを計算すると、モデルのR 2はモデルより明らかに高くなります。メソッドがどのように優れているかについての論文を書く前に、違いが偶然ではないこと、おそらくp値の形である種の指標を得たいと思います。R2R2R^2R2R2R^2m1m2X1X2 これについてはどうすればよいでしょうか?異なるブランドのバナナを使用しているときに、バナナブランドをランダムエフェクトとして組み込んだ線形混合効果モデルに移行する方法を教えてください。

1
フィッティング値を大きくしてスプレッドが減少したときに分散の不均一性をどうするか
Rコードが次のような線形混合モデルを作成しようとしています。 lme(Average.payoff〜Game + Type + Others.Type + Game:Type + Game:Others.Type + Type:Others.Type、random =〜1 | Subjects、method = "REML"、data = Subjectsm1)-> lme1 応答項Average.payoffは連続ですが、すべての説明変数はすべてバイナリです。 検証に来ると、フィット値が大きくなると残差の広がりが減少することがはっきりとわかります。近似値が大きくなると残差が増加する形で不均一性に関する情報がたくさんあるようですが、私は自分のケースに似たケースについては何も読んでいません。 各説明効果に対して残差をプロットしましたが、変数GameおよびTypeの近似値が大きいほどスプレッドが減少しますが、変数Others.Typeの場合は増加することがわかります。 これの原因は何ですか?それについて私は何をすべきですか? 2次項の追加または加法モデリングの使用を検討すべきですか?適用すべき変換はありますか? おかげで、 ジョナサン

1
固定効果なしでlmerモデルを指定することは可能ですか?
Rでは、グローバル固定効果なしでlmerモデルをどのように指定しますか?たとえば、私が次のようなことを言った場合 lmer(y ~ (1 | group) + (0 + x | group), data = my_df) 適合モデルは yij=a+αi+βixijyij=a+αi+βixijy_{ij} = a + \alpha_{i} + \beta_{i} x_{ij} モデルの適合方法 yij=αi+βixijyij=αi+βixijy_{ij} = \alpha_{i} + \beta_{i} x_{ij}?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.