タグ付けされた質問 「random-effects-model」

共変量の特定のレベルに関連付けられているパラメーターは、レベルの「影響」と呼ばれることがあります。観察されるレベルがすべての可能なレベルのセットからのランダムなサンプルを表す場合、これらの効果を「ランダム」と呼びます。

1
混合効果モデルの推定値の標準誤差はどのように計算する必要がありますか?
特に、線形混合効果モデルの固定効果の標準誤差をどのように計算する必要がありますか(頻度主義的な意味で)? Laird and Ware [1982]で提示されているような典型的な推定値()がSEに与えるとされました推定された分散成分は真の値として扱われるため、サイズが過小評価されます。Var(β^)=(X′VX)−1Var(β^)=(X′VX)−1{\rm Var}(\hat\beta)=(X'VX)^{-1} R のパッケージ内のlmeおよびsummary関数によって生成されるSE nlmeは、上記の分散共分散行列の対角の平方根に単純に等しくないことに気付きました。それらはどのように計算されますか? また、ベイジアンは分散成分の推定に逆ガンマ事前分布を使用するという印象を受けています。これらは(正しい設定で)と同じ結果をもたらしlmeますか?

2
REMLまたはMLは、異なる固定効果を持つ2つの混合効果モデルを比較しますが、同じランダム効果を持ちますか?
背景: 注:テキストの下にデータセットとRコードが含まれています AICを使用して、Rのlme4パッケージを使用して生成された2つの混合効果モデルを比較します。各モデルには、1つの固定効果と1つのランダム効果があります。固定効果はモデル間で異なりますが、ランダム効果はモデル間で同じままです。REML = Tを使用すると、model2のAICスコアが低くなりますが、REML = Fを使用すると、model1のAICスコアが低くなります。 MLの使用のサポート: ズール等。(2009; PAGE 122)「ネストされた固定効果(ただし、同じランダム構造)を持つモデルを比較するには、REMLではなくML推定を使用する必要がある」ことを示唆しています。これは、ランダム効果は両方のモデルで同じですが、固定効果は異なるため、MLを使用する必要があることを示しています。[Zuur et al。2009.エコロジーにおける混合効果モデルと拡張機能とR.スプリンガー。] REMLの使用のサポート: ただし、MLを使用すると、ランダム効果に関連付けられた残差分散は2つのモデル間で異なります(model1 = 136.3; model2 = 112.9)が、REMLを使用するとモデル間で同じです(model1 = model2 = 151.5)。これは、ランダムな残差分散が同じランダム変数を持つモデル間で同じままになるように、代わりにREMLを使用する必要があることを意味します。 質問: 固定効果が変化し、ランダム効果が同じままであるモデルの比較に、MLよりもREMLを使用する方が理にかなっていますか?そうでない場合は、理由を説明したり、詳細を説明している他の文献を教えてください。 # Model2 "wins" if REML=T: REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T) REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T) AIC(REMLmodel1,REMLmodel2) …

1
lmer()モデルの変量効果の分散を理解する
lmer()モデルの出力を理解できません。これは、さまざまな状態インターセプト/状態ランダム効果を持つ結果変数(サポート)の単純なモデルです。 mlm1 <- lmer(Support ~ (1 | State)) 結果は次のsummary(mlm1)とおりです。 Linear mixed model fit by REML Formula: Support ~ (1 | State) AIC BIC logLik deviance REMLdev 12088 12107 -6041 12076 12082 Random effects: Groups Name Variance Std.Dev. State (Intercept) 0.0063695 0.079809 Residual 1.1114756 1.054265 Number of obs: 4097, groups: State, …

1
クラスター化されたデータの適切なブートストラップ手法?
強力なクラスタリングが存在するデータで使用する適切なブートストラップ手法に関する質問があります。 私は、最新の請求データに基づいて現在のベースラインモデルをスコアリングすることにより、保険請求データの多変量混合効果予測モデルを評価するタスクを担当しました95パーセンタイル)。モデルの有効性を評価するために、感度、特異性、および正の予測値(PPV)が使用されます。 ブートストラップは、感度、特異性、PPVの割合の信頼区間を構築する正しい方法のようです。残念なことに、素朴なブートストラップは、請求データが1)ケア提供者によって相関付けられていること、2)ケアのエピソードの数か月前に頻繁に訪問するケアのエピソードにグループ化されているため、適切ではありません(そのため、自己相関が存在します)。ムービングブロックブートストラップテクニックのバリエーションはここで適切でしょうか? または、3段階のブートストラップ手順が機能する可能性があります:1)データ内の個別のプロバイダーからの置換のサンプル、2)選択したプロバイダーによる個別のケアエピソードの置換のサンプル、3)各内の個別のクレームからの置換のサンプル選択したエピソード。 ご提案ありがとうございます!

4
混合効果モデルにすべての可能性が含まれる場合の固定効果とランダム効果
混合効果モデルでは、可能なレベルがすべて含まれている場合(男性と女性の両方など)、固定効果を使用してパラメーターを推定することをお勧めします。さらに、含まれるレベルが母集団(可能性のある患者の宇宙から登録された患者)からのランダムなサンプルであり、平均値の代わりに母集団の平均と分散を推定する場合、変数を説明するためにランダム効果を使用することをさらにお勧めします個々の因子レベルの。 この方法で常に固定効果を使用することが論理的に義務付けられているのかどうか疑問に思っています。開発によって足/靴のサイズがどのように変化し、たとえば身長、体重、年齢に関連するかについての研究を検討してください。 SideSide{\rm Side}長年にわたる測定値が特定のフィート内にネストされ、独立していないという事実を説明するために、モデルに何らかの形で明確に含める必要があります。さらに、右と左はすべて存在する可能性です。さらに、特定の参加者の右足が左足よりも大きい(または小さい)ことは事実です。ただし、すべての人の足のサイズは足によって多少異なりますが、平均して右足が左足よりも大きいと考える理由はありません。サンプルに含まれている場合、これはおそらく、右足に内在するものではなく、サンプルに含まれる人々の遺伝学に関する何かによるものです。最後に、sの私のD Eをs私de{\rm side}は迷惑なパラメータのように見えますが、あなたが本当に気にするものではありません。 この例を作成したことに注意してください。それは何の役にも立たないかもしれません。アイデアを広めるためだけです。私が知っているすべての人にとって、旧石器時代の生存には大きな右足と小さな左足が必要でした。 このような場合、ランダムな効果としてモデルにを組み込むことは(より多く/より少なく/任意に)意味があるsの私のD Eをs私de{\rm side}でしょうか?ここで固定効果とランダム効果を使用する場合の長所と短所は何でしょうか?

1
混合効果モデルが依存関係を解決するのはなぜですか?
学生の試験の成績が、それらの学生が勉強する時間数によってどのように影響されるかに興味があるとします。この関係を調べるために、次の線形回帰を実行できます。 exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i しかし、複数の異なる学校の生徒をサンプリングすると、同じ学校の生徒は、異なる学校の生徒よりも互いに似ていると思われるかもしれません。この依存関係の問題に対処するために、多くの教科書/ Webでのアドバイスは、混合効果を実行し、ランダム効果として学校に入ることです。したがって、モデルは次のようになります。 しかし、これにより、線形回帰?exam.gradesi=a+β1×hours.studiedi+schoolj+eiexam.gradesi=a+β1×hours.studiedi+schoolj+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + \text{school}_j + e_i 12歳の子供と話しているかのように返信してください

3
固定/ランダム効果モデルの背後にある概念
誰かが固定/ランダム効果モデルを理解するのを手伝ってくれますか?これらの概念を消化した場合は、独自の方法で説明するか、特定のアドレス(ページ番号、章など)でリソース(書籍、メモ、Webサイト)に移動して、混乱なく学習できるようにします。 これは本当ですか:「一般に固定効果があり、ランダム効果は特定のケースです」?説明が一般的なモデルから固定およびランダムな効果のある特定のモデルに移行する場合に特に助けていただければ幸いです

2
誰かが線形と非線形の混合効果に光を当てることができますか?
Rの学習に飛び込もうとしています。私の学習プロジェクトでは、予測式を作成するために、混合効果またはランダム効果の回帰をデータセットに適用する必要があります。この投稿で筆者の懸念を共有 します。混合効果モデルでnlmeまたはlme4 Rライブラリを選択する方法は?NLMEとLME4のどちらが自分に馴染みやすいパッケージなのか疑問に思います。より基本的な質問は、線形混合効果と非線形混合効果のモデリングの違いは何ですか? 背景については、MSの研究(MEではなくR)でMEモデリングを適用したため、固定変数とランダム変数の処理方法に精通しています。しかし、私が行った作業が線形MEと非線形MEのどちらであるかは定かではありません。それは単に使用された方程式の機能的な形なのか、それとも何か他のものなのか?

2
SAS PROC GLIMMIXが二項glmmに対してglmer(lme4)とは非常に異なるランダムな勾配を与えるのはなぜですか
私はRに精通しているユーザーであり、4つの生息地変数について5年間で約35人のランダムな勾配(選択係数)を推定しようとしています。応答変数は、場所が「使用済み」(1)または「使用可能」(0)の生息地(以下「使用」)であったかどうかです。 Windows 64ビットコンピューターを使用しています。 Rバージョン3.1.0では、以下のデータと式を使用します。PS、TH、RS、およびHWは固定効果です(標準化された、測定された生息地までの距離)。lme4 V 1.1-7。 str(dat) 'data.frame': 359756 obs. of 7 variables: $ use : num 1 1 1 1 1 1 1 1 1 1 ... $ Year : Factor w/ 5 levels "1","2","3","4",..: 4 4 4 4 4 4 4 4 3 4 ... $ ID : …

5
非常に多数のデータポイントで値の代入を実行する方法は?
非常に大きなデータセットがあり、約5%のランダムな値が欠落しています。これらの変数は互いに相関しています。次のRデータセットの例は、ダミーの相関データを使用した単なるおもちゃの例です。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
経験的ベイズとランダム効果の間には関係がありますか?
私は最近、経験的ベイズについて偶然読んで(Casella、1985、経験的ベイズデータ分析の紹介)、ランダム効果モデルによく似ていました。両方ともグローバル平均に縮小した推定値を持っているという点で。しかし、私はそれを完全に読んでいません... 誰もがそれらの類似点と相違点について何か洞察を持っていますか?

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
Rでbetareg関数を使用して混合モデルを実装する方法は?
私は、個々のオタマジャクシの「活動レベル」を測定する比率で構成されるデータセットを持っているため、値は0と1の間でバインドされます。このデータは、特定の時間間隔(移動の場合は1動きがない場合は0)、平均して個人ごとに1つの値を作成します。私の主な固定効果は「密度レベル」でしょう。 私が直面している問題は、変量効果として含めたい因子変数「池」があることです。池の違いは気にしませんが、統計的に考慮します。池に関する重要な点の1つは、池が3つしかないことです。ランダムな効果を処理するときは、より多くの因子レベル(5+)を持つことが理想的であることを理解しています。 可能であれば、Rを使用して、betareg()またはbetamix()Rで混合モデルを実装する方法についてアドバイスをお願いします。Rのヘルプファイルを読んだことがあるのですが、通常、それらを理解するのは難しいと感じます(各引数パラメーターが実際に意味するところ)私自身のデータと、生態学的な意味での出力値の意味)ので、例を介してよりよく働く傾向があります。 関連するノートでは、代わりにglm()二項ファミリーの下でロジットリンクを使用して、この種のデータで変量効果を説明できるかどうか疑問に思っていました。

3
変量効果モデルで正則化手法を使用できますか(すべきですか?)
正則化手法とは、投げ縄、尾根回帰、弾性網などを指します。 入院患者の滞在期間が予測される人口統計データと診断データを含むヘルスケアデータの予測モデルを考えてみましょう。一部の個人では、相関するベースライン期間中に複数のLOS観測(つまり、複数のIPエピソード)があります。 たとえば、各個人の変量効果切片項を含むエラスティックネット予測モデルを構築することには意味がありますか?

1
マージナルモデルと変量効果モデル–どちらを選択するか?素人へのアドバイス
周辺モデルと変量効果モデル、およびそれらの間の選択方法に関する情報を検索すると、いくつかの情報が見つかりましたが、それは多かれ少なかれ数学的な抽象的な説明でした(例:https://stats.stackexchange .com / a / 68753/38080)。どこかで、これら2つのメソッド/モデル(http://www.biomedcentral.com/1471-2288/2/15/)の間のパラメーター推定値の間に実質的な違いが観察されたことがわかりましたが、その反対はZuur et alによって書かれました。(2009、p。116; http://link.springer.com/book/10.1007%2F978-0-387-87458-6)。マージナルモデル(一般化推定方程式アプローチ)は母集団平均パラメーターをもたらしますが、ランダム効果モデル(一般化線形混合モデル)からの出力はランダム効果を考慮します–主題(Verbeke et al。2010、pp。49–52; http:/ /link.springer.com/chapter/10.1007/0-387-28980-1_16)。 非統計学者や非数学者に馴染みのある言語で、いくつかのモデル(実生活)の例に示されているこれらのモデルの素人のような説明を見せてください。 詳しく知りたいのですが: 周辺モデルを使用する必要がある場合と、変量効果モデルを使用する必要がある場合 これらのモデルはどの科学的質問に適していますか? これらのモデルからの出力はどのように解釈されるべきですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.