タグ付けされた質問 「mixed-model」

混合(別名マルチレベルまたは階層)モデルは、固定効果と変量効果の両方を含む線形モデルです。これらは、長期的またはネストされたデータをモデル化するために使用されます。

1
1つの観測値のみのランダム効果は、一般化線形混合モデルにどのように影響しますか?
ランダム効果として使用したい変数がいくつかのレベルで単一の観測値を持つデータセットがあります。以前の質問への回答に基づいて、原則としてこれで問題ないことをまとめました。 混合モデルを、観測値が1つだけの被験者に適合させることはできますか? ランダム切片モデル-被験者ごとに1つの測定 ただし、2番目のリンクでは、最初の答えは次のとおりです。 「...一般的な線形混合モデルGLMMを使用していないと仮定します。この場合、過剰分散の問題が発生します」 GLMMの使用を検討していますが、1回の観測でのランダムな効果レベルがモデルにどのように影響するかを本当に理解していません。 ここに、私が当てはめようとしているモデルの1つの例を示します。私は鳥を研究していますが、移動中のストップの数に対する人口と季節の影響をモデル化したいと思います。一部の個人では最大5年間のデータがあるため、個人をランダム効果として使用したいと思います。 library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "NU", "NU", "NU", …

1
完全な列ランク未満の制限付き最尤法
この質問は、線形モデルの特定のバージョンにおける制限付き最尤法(REML)の推定を扱っています。 Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)),Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)), Y = X(\alpha)\beta + \epsilon, \\ \epsilon\sim N_n(0, \Sigma(\alpha)), ここで、は、と同様に、でパラメーター化された()行列です。は迷惑パラメーターの未知のベクトルです。関心が推定である、私たちは持っている。最尤法によるモデルの推定は問題ありませんが、REMLを使用したいと思います。これはよく知られており、例えば、参照LaMotteを、尤度その、なるよう任意の半直交行列である書くことができます。X(α)X(α)X(\alpha)n×pn×pn \times pα∈Rkα∈Rk\alpha \in \mathbb R^kΣ(α)Σ(α)\Sigma(\alpha)ββ\betaαα\alphak≤p≪nk≤p≪nk\leq p\ll nA′YA′YA'YAAAA′X=0A′X=0A'X=0 LREML(α∣Y)∝|X′X|1/2|Σ|−1/2|X′Σ−1X|−1/2exp{−12r′Σ−1r},r=(I−X(X′Σ−1X)+X′Σ−1)Y,LREML(α∣Y)∝|X′X|1/2|Σ|−1/2|X′Σ−1X|−1/2exp⁡{−12r′Σ−1r},r=(I−X(X′Σ−1X)+X′Σ−1)Y, L_{\text{REML}}(\alpha\mid Y) \propto\vert X'X\vert^{1/2} \vert \Sigma\vert^{-1/2}\vert X'\Sigma^{-1}X\vert^{-1/2}\exp\left\{-\frac{1}{2} r'\Sigma^{-1}r \right\}, \\ r = (I - X(X'\Sigma^{-1}X)^+X'\Sigma^{-1})Y, when XXX is full column rank. My problem is that for some perfectly reasonable, and …

1
混合効果モデルが依存関係を解決するのはなぜですか?
学生の試験の成績が、それらの学生が勉強する時間数によってどのように影響されるかに興味があるとします。この関係を調べるために、次の線形回帰を実行できます。 exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i しかし、複数の異なる学校の生徒をサンプリングすると、同じ学校の生徒は、異なる学校の生徒よりも互いに似ていると思われるかもしれません。この依存関係の問題に対処するために、多くの教科書/ Webでのアドバイスは、混合効果を実行し、ランダム効果として学校に入ることです。したがって、モデルは次のようになります。 しかし、これにより、線形回帰?exam.gradesi=a+β1×hours.studiedi+schoolj+eiexam.gradesi=a+β1×hours.studiedi+schoolj+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + \text{school}_j + e_i 12歳の子供と話しているかのように返信してください

1
Rの非線形混合効果回帰
驚いたことに、Googleを使用して次の質問に対する答えを見つけることができませんでした。 私はいくつかの個人からのいくつかの生物学的データを持っていますが、それはおおよそS字状の成長挙動を示しています。したがって、標準のロジスティック成長を使用してモデル化したい P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) p0はt = 0での開始値、kはt-> infinityでの漸近極限、rは成長速度です。私が見る限り、nlsを使用してこれを簡単にモデル化することができます(私の理解が不足しています:時間とデータをスケーリングすることにより、標準のロジット回帰を使用して類似のものをモデル化できないのはなぜですか?編集:ニック、どうやら、例えばプロポーションですが、めったにhttp://www.stata-journal.com/article.html?article=st0147この接線に関する次の質問は、モデルが異常値を処理できるかどうかです> 1)。 ここで、3つのパラメーターk、p0、およびrに対する固定(主にカテゴリー)およびランダム(個別のID、場合によってはスタディID)の効果を許可したいと思います。nlmeはこれを行う最良の方法ですか?SSlogisモデルは、私がやろうとしていることに対して賢明なようです、それは正しいですか?次のいずれかが賢明なモデルから始まりますか?開始値を正しく取得できないようで、update()はランダムな効果に対してのみ機能し、固定された効果に対しては機能しないようです-ヒントはありますか? nlme(y ~ k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)), ## not working at all (bad numerical properties?) data = data, fixed = k + p0 + r ~ var1 + var2, random = k + p0 + r ~ 1|UID, start …

1
これは、Rでlme4を使用した混合効果モデルを分析するのに受け入れられる方法ですか?
分析するための不均衡な反復測定データセットがあり、ほとんどの統計パッケージがこれをANOVA(つまり、タイプIIIの二乗和)で処理する方法が間違っていることを読みました。したがって、これらのデータを分析するために混合効果モデルを使用したいと思います。私はで混合モデルについて多くのことを読みましたRが、私はまだ混合モデルに非常に新しく、R自信を持っていません。「伝統的な」方法から完全に離婚することはまだできず、値と事後検定が必要であることに注意してください。ppp 次のアプローチが理にかなっているのか、何かひどい間違いをしているのかを知りたい。ここに私のコードがあります: # load packages library(lme4) library(languageR) library(LMERConvenienceFunctions) library(coda) library(pbkrtest) # import data my.data <- read.csv("data.csv") # create separate data frames for each DV & remove NAs region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1)) # output summary of data data.summary <- summary(region.data) # fit model # "time" is a factor with three …

2
LME()エラー-反復制限に達しました
交差混合効果モデルを指定する際に、相互作用を含めようとしています。ただし、次のエラーメッセージが表示されます。 Error in lme.formula(rate ~ nozzle, random = ~nozzle | operator, data = Flow) : nlminb problem, convergence error code = 1 message = iteration limit reached without convergence (10) モデルには次のようなものがあります。1. 3つのノズルタイプ(固定効果)2. 5つのオペレーター。それぞれ3つのノズルタイプからの燃料流量に対する3つの繰り返し測定があります。 モデルにノズルタイプとオペレーターの相互作用を含めるように求められました。これはモデルの私のコードです: flow.lme <- lme(rate ~ nozzle, error= nozzle|operator, data=Flow) なぜこのエラーメッセージが表示されるのですか?

3
固定/ランダム効果モデルの背後にある概念
誰かが固定/ランダム効果モデルを理解するのを手伝ってくれますか?これらの概念を消化した場合は、独自の方法で説明するか、特定のアドレス(ページ番号、章など)でリソース(書籍、メモ、Webサイト)に移動して、混乱なく学習できるようにします。 これは本当ですか:「一般に固定効果があり、ランダム効果は特定のケースです」?説明が一般的なモデルから固定およびランダムな効果のある特定のモデルに移行する場合に特に助けていただければ幸いです

1
バイナリデータとの相関における分散分割と縦方向の変化
ロジスティック線形混合効果モデル(ランダムインターセプト)を使用して、175校の300,000人の生徒に関するデータを分析しています。各生徒は1回だけ発生し、データは6年間に及びます。 継続的な成果のためにVPC / ICCと同様の方法で、学校レベルと生徒レベル間の分散をどのように分割しますか?私は4つの方法を提案するこの記事を見てきましたが、そのうちAとBは私にとって興味深いものですが、これらのいずれかを使用することでどのような利点/欠点があるか、そしてもちろん他の方法があるかどうかを知りたいですそれ。 年ごと(または他の期間)の学校レベルの残差をどのように比較できますか?これまでのところ私は年によってデータを分割し、データの各年に対するモデルを実行することによって、これを行っているが、私はので、これは欠陥があると思う:私は)私はによって分割すべき理由は明白な理由がない年は、ii)固定効果の推定値は年ごとに異なるため、年ごとの変量効果の比較は意味をなさない場合があります(これは私の直感であり、誰かがこれをより正式に説明できれば正しいと思います)。 注:whuberおよびMacroとのメタでの議論の後、この質問を書き直しました。

1
カテゴリ変数(R内)で使用できるさまざまなタイプのコーディングと、それらをいつ使用しますか?
線形モデルまたは混合モデルを近似する場合、カテゴリーまたはノミナルバリベールを、ダミーコンディング(Rデフォルト)やエフェクトコーディングなど、パラメーターが推定される多くの変数に変換するために使用できるさまざまなタイプのコーディングがあります。 相互作用がある場合、エフェクトコーディング(偏差またはコントラストコーディングと呼ばれることもあります)が好ましいと聞きましたが、可能なコントラストはどのようなもので、どのタイプのコントラストを使用するのですか? コンテキストはを使用したRでの混合モデリングですが、lme4より広範な応答は問題ないと思います。申し訳ありませんが、同様の質問を逃した場合。 編集:2つの有用なリンクがあります:効果コーディングと説明されたダミーコーディング。

2
ARMA / ARIMAは混合エフェクトモデリングとどのように関連していますか?
パネルデータ分析では、ランダム/混合効果を備えたマルチレベルモデルを使用して、自己相関問題(つまり、観測が時間の経過とともに個人内でクラスター化される)を追加し、他のパラメーターを追加して、時間とショックの特定の仕様を調整しました。ARMA / ARIMAは、同様の問題に対処するように設計されているようです。 私がオンラインで見つけたリソースでは、時系列(ARMA / ARIMA)または混合効果モデルのいずれかについて説明していますが、回帰に基づいて構築することを超えて、2つの関係を理解し​​ていません。マルチレベルモデル内からARMA / ARIMAを使用したい場合がありますか?2つが同等または冗長であるという意味はありますか? これについて議論するリソースへの回答またはポインタは素晴らしいでしょう。

2
混合効果モデルからの予測値の周りの信頼区間はどういう意味ですか?
このページを見ていましたRのlmeとlmerの信頼区間のメソッドに注目しました。Rを知らない人にとっては、混合効果またはマルチレベルモデルを生成するための関数です。反復測定デザインのようなものに固定効果がある場合、予測値(平均と同様)の周りの信頼区間はどういう意味ですか?効果のために合理的な信頼区間を設定できることは理解できますが、そのような設計で予測された平均値の周りの信頼区間は不可能に思えます。ランダム変数が推定値の不確実性に寄与するという事実を認識することは非常に大きい可能性がありますが、その場合、値全体を比較する推論的な意味ではまったく役に立ちません。または、 ここに何か欠けているのか、状況の分析が正しいのか?... [そしておそらく、それがlmerで実装されていない理由の正当化(しかしSASで簡単に取得できる)。:)]

4
フォローアップ:混合ANOVA間ANOVAプロットでは、推定SEまたは実際のSEですか?
私は現在論文を書き終えており、昨日からこの質問につまずいたので、自分に同じ質問を投げかけることになりました。データからの実際の標準誤差または私のANOVAから推定された標準誤差をグラフに提供する方が良いでしょうか? 昨日からの質問はかなり具体的ではなく、私の質問はかなり具体的であるため、このフォローアップの質問を提示することが適切だと思いました。 詳細: 認知心理学の領域(条件付き推論)で実験を実行し、2つのグループ(帰納的および演 ductive的指示、つまり被験者間操作)を2つの被験者内操作(問題のタイプと問題の内容、それぞれ2つの因子レベル)。 結果は次のようになります(ANOVA出力からのSE推定値の左パネル、データから推定されたSEの右パネル): 異なる線は2つの異なるグループ(つまり、被験者間操作)と、被験者の操作はx軸(つまり、2x2因子レベル)にプロットされます。 本文では、ANOVAのそれぞれの結果と、中央の重要なクロスオーバー相互作用の計画的な比較を提供します。SEは、データの変動性に関するヒントを読者に提供するためにあります。SDをプロットすることは一般的ではなく、被験者内および被験者間CIを比較する際に深刻な問題があるため、標準偏差および信頼区間よりもSEの方が好きです(同じことがSEにも当てはまるため、有意差を誤って推測することはそれほど一般的ではありません)それらから)。 私の質問を繰り返します:ANOVAから推定されたSEをプロットする方が良いのですか、それとも生データから推定されたSEをプロットすべきですか? 更新: 推定SEが何であるかをもう少し明確にすべきだと思います。SPSSのANOVA出力はestimated marginal means、対応するSEとCIを提供します。これが左のグラフにプロットされています。これを理解している限り、それらは残差のSDである必要があります。ただし、残差を保存する場合、SDは推定SEに多少なりとも近くありません。したがって、2番目の(潜在的にSPSS固有の)質問は次のとおり です。これらのSEとは何ですか? 更新2:最終的に気に入ったのでプロットを作成できるR関数を作成することができました(受け入れられた回答を参照)。誰かに時間があれば、あなたがそれを見ることができれば本当に感謝します。ここにあります。

5
混合効果モデル:グループ化変数のレベル全体でランダム分散成分を比較
私は参加者がいて、それぞれが 20回、ある条件で10回、別の条件で10回応答するとします。各条件でを比較する線形混合効果モデルを近似します。以下のパッケージを使用して、この状況をシミュレートする再現可能な例を示します。NNNYYYYYYlme4R library(lme4) fml <- "~ condition + (condition | participant_id)" d <- expand.grid(participant_id=1:40, trial_num=1:10) d <- rbind(cbind(d, condition="control"), cbind(d, condition="experimental")) set.seed(23432) d <- cbind(d, simulate(formula(fml), newparams=list(beta=c(0, .5), theta=c(.5, 0, 0), sigma=1), family=gaussian, newdata=d)) m <- lmer(paste("sim_1 ", fml), data=d) summary(m) モデルmは、2つの固定効果(条件の切片と勾配)、および3つのランダム効果(参加者ごとのランダム切片、条件の参加者ごとのランダム勾配、切片と勾配の相関)を生成します。 によって定義されたグループ全体で、参加者ごとのランダムインターセプト分散のサイズを統計的に比較しますcondition(つまり、コントロールと実験条件内で赤で強調表示された分散コンポーネントを計算し、コンポーネントのサイズの違いがゼロ以外)。どうすればこれを行うことができますか? ボーナス モデルがもう少し複雑であるとしましょう:参加者はそれぞれ10回の刺激を20回、1つの条件で10回、別の条件で10回経験します。したがって、交差ランダム効果には、参加者のランダム効果と刺激のランダム効果の2つのセットがあります。再現可能な例を次に示します。 library(lme4) fml <- "~ condition …

1
ポアソン回帰にはエラー用語がありますか?
ポアソン回帰にエラー項があるかどうか疑問に思っていましたか?ポアソン回帰には、ランダム効果と誤差項がありますか?私はこの点について混乱しています。ロジスティック回帰では、結果変数がバイナリであるため、エラー用語はありません。それは残差項を持たない唯一のglmモデルですか?

6
パネルデータと混合モデルの違い
パネルデータ分析と混合モデル分析の違いを知りたいです。私の知る限り、パネルデータと混合モデルはどちらも固定効果とランダム効果を使用しています。もしそうなら、なぜ彼らは異なる名前を持っていますか?それとも同義語ですか? 固定効果、ランダム効果、混合効果の定義を説明する次の投稿を読みましたが、私の質問に正確には答えていません:固定効果モデル、ランダム効果モデル、混合効果モデルの違いは何ですか? また、混合モデル分析に関する簡単な(約200ページ)参照を誰かが私に紹介してくれた場合もありがたいです。付け加えると、ソフトウェアの扱いに関係なく、混合モデリングのリファレンスを好むでしょう。混合モデリングの主に理論的な説明。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.