タグ付けされた質問 「multilevel-analysis」

階層のいくつかのレベルで構成されるデータセットの統計分析(例:学校に入れ子にされたクラスに入れ子になった生徒、または階層的な予測)。混合モデルに関する質問については、[mixed-model]タグを使用してください。ネストされたランダム効果には、[nested-data]を使用します。

2
クラスターレベルまたは個別レベルでブートストラップする必要がありますか?
私は病院に入れ子にされた患者の生存モデルを持っています。これには病院のランダム効果が含まれます。ランダム効果はガンマ分布であり、私はこの用語の「関連性」を簡単に理解できる尺度で報告しようとしています。 中央ハザード比(中央値オッズ比に少し似ています)を使用する次の参照を見つけ、これを計算しました。 Bengtsson T、Dribe M:歴史的方法43:15、2010 ただし、ここで、ブートストラップを使用してこの推定に関連する不確実性を報告したいと思います。データは生存データであるため、患者ごとに複数の観測値があり、病院ごとに複数の患者があります。再サンプリング時に患者の観察をクラスタリングする必要があることは明らかです。しかし、病院をクラスタ化する必要があるかどうかもわかりません(つまり、患者ではなく病院をリサンプルしますか? 答えが関心のあるパラメーターに依存するかどうか疑問に思っています。したがって、ターゲットが病院レベルではなく患者レベルで関連性のあるものである場合、結果は異なりますか? それが役立つ場合に備えて、以下のstataコードをリストしました。 cap program drop est_mhr program define est_mhr, rclass stcox patient_var1 patient_var2 /// , shared(hospital) /// noshow local twoinvtheta2 = 2 / (e(theta)^2) local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75)) return scalar mhr = `mhr' end bootstrap r(mhr), reps(50) cluster(hospital): est_mhr

1
マルチレベルモデリングの表記
(ライブラリlmerから使用する)マルチレベルモデルをトレーニングするために指定する必要がある式は、lme4 R常に私にわかります。私は無数の教科書やチュートリアルを読みましたが、それを適切に理解したことがありません。 だからここに私が方程式に定式化して欲しいこのチュートリアルの例があります。さまざまなシナリオでの性別(女性は一般的に男性よりもピッチの高い声を持っています)と人の態度(丁寧に答えたかどうかにかかわらず)の関数として音声周波数をモデル化しようとしています。また、subjectコラムからわかるように、一人一人が数回測定を受けました。 > head(politeness, n=20) subject gender scenario attitude frequency 1 F1 F 1 pol 213.3 2 F1 F 1 inf 204.5 3 F1 F 2 pol 285.1 4 F1 F 2 inf 259.7 5 F1 F 3 pol 203.9 6 F1 F 3 inf 286.9 7 F1 F …


2
複数の比較のための階層モデル-複数の結果のコンテキスト
私は、(通常)多重比較を心配する必要がない(通常) Gelmanの(再)を読んだばかりです。特に、「複数の結果とその他の課題」のセクション では、同じ人物/ユニットからの複数の関連する測定が異なる時間/条件である場合の階層モデルの使用について言及しています。それは多くの望ましい特性を持っているようです。 これは必ずしもベイジアンのものではないことを理解しています。誰かがrjagsやlmer(通常のJAGSやBUGSだけでなく、MCMCglmmなどの他の混合モデルライブラリも問題ないはずです)を使用して多変量マルチレベルモデルを適切に構築する方法を教えてくれます。対照的な結果?モデルが欲しい状況のタイプは、以下のおもちゃのデータ(多変量、反復測定)に反映されています。 set.seed(69) id <- factor(rep(1:20, 2)) # subject identifier dv1 <- c(rnorm(20), rnorm(20, 0.8, 0.3)) # dependent variable 1 data for 2 conditions dv2 <- c(rnorm(20), rnorm(20, 0.3, 0.6)) dv3 <- c(rnorm(20), rnorm(20, -0.3, 0.8)) dv4 <- c(rnorm(20), rnorm(20, 0.2, 1 )) dv5 <- c(rnorm(20), rnorm(20, 0.5, …


2
非常に不規則な時系列
私は、約5年間にわたってサンプリングされた、非常に不規則なパターンで、さまざまな魚の個体数のデータを持っています。サンプル間に数か月ある場合もあれば、1か月に複数のサンプルがある場合もあります。0カウントもたくさんあります そのようなデータをどのように扱うのですか? Rでは十分簡単に​​グラフ化できますが、非常にでこぼこなので、グラフは特に明るくはありません。 モデリングの観点から-種をさまざまなものの関数としてモデル化-多分混合モデル(別名マルチレベルモデル)。 どんな参考やアイデアも歓迎します コメントに応じた詳細 約15種あります。 私は、各魚の傾向や季節性を把握し、種が互いにどのように関連しているかを調べようとしています(クライアントはもともと、単純な相関関係の表が必要でした) 目標は予測的ではなく、説明的で分析的です さらに編集:私はこの論文をK. Rehfieldらによって見つけました。これは、ガウスカーネルを使用して非常に不規則な時系列のACFを推定することを示唆しています http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

2
縦断的研究で平均治療効果を推定する最良の方法は何ですか?
縦断的研究では、ユニット結果が時点で繰り返し測定され、合計固定測定機会があります(固定=ユニットの測定は同時に行われます)。YitYitY_{it}iiitttmmm 単位は、治療、または対照群いずれかにランダムに割り当てられます。治療の平均的な効果を推定してテストしたいと思います。つまり、時間と個人全体で期待値が得られます。この目的のために、固定された機会のマルチレベル(混合効果)モデルの使用を検討します。G=1G=1G=1G=0G=0G=0ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yit=α+βGi+u0i+eitYit=α+βGi+u0i+eitY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} インターセプト、、ユニットにわたってランダム切片、及び残差を。αα\alphaββ\betaATEATEATEuuueee 今、私は代替モデルを検討しています Yit=β~Gi+∑j=1mκjdij+∑j=1mγjdijGi+u~0i+e~itYit=β~Gi+∑j=1mκjdij+∑j=1mγjdijGi+u~0i+e~itY_{it} = \tilde{\beta} G_i + \sum_{j=1}^m \kappa_j d_{ij} + \sum_{j=1}^m \gamma_j d_{ij} G_i + \tilde{u}_{0i} + \tilde{e}_{it} これは固定効果が含ま都度のためのダミー場合と他。さらに、このモデルには、パラメータを使用した治療と時間の相互作用が含まれています。したがって、このモデルでは、の影響が時間の経過とともに異なる可能性があることを考慮しています。これ自体は参考情報ですが、の不均一性が考慮されるため、パラメーターの推定の精度も向上するはずです。κjκj\kappa_jtttdt=1dt=1d_t=1j=tj=tj=t000γγ\gammaGGGYYY ただし、このモデルでは、係数はと等しくないようです。代わりに、最初にATEを表します()。推定だからよりも効率的かもしれが、それは表していませんもう。β~β~\tilde{\beta}ATEATEATEt=1t=1t=1β~β~\tilde{\beta}ββ\betaATEATEATE 私の質問は: この縦断的研究デザインで治療効果を推定する最良の方法は何ですか? モデル1を使用する必要がありますか、それとも(おそらくより効率的な)モデル2を使用する方法はありますか? にの解釈との機会固有の偏差を持たせる方法はありますか(たとえば、エフェクトコーディングを使用して)?β~β~\tilde{\beta}ATEATEATEγγ\gamma

1
マルチレベルのロジスティック回帰モデルの推定
レベル1(個別レベル)に1つの説明変数とレベル2(グループレベル)に1つの説明変数を持つ次のマルチレベルロジスティックモデル: logit(pij)=π0j+π1jxij…(1)logit(pij)=π0j+π1jxij…(1)\text{logit}(p_{ij})=\pi_{0j}+\pi_{1j}x_{ij}\ldots (1) π0j=γ00+γ01zj+u0j…(2)π0j=γ00+γ01zj+u0j…(2)\pi_{0j}=\gamma_{00}+\gamma_{01}z_j+u_{0j}\ldots (2) π1j=γ10+γ11zj+u1j…(3)π1j=γ10+γ11zj+u1j…(3)\pi_{1j}=\gamma_{10}+\gamma_{11}z_j+u_{1j}\ldots (3) ここで、グループレベルの残差およびは、期待値がゼロの多変量正規分布であると想定されます。残差誤差の分散は として指定され、残差誤差の分散は として指定されます。u0ju0ju_{0j}u1ju1ju_{1j}u0ju0ju_{0j}σ20σ02\sigma^2_0u1ju1ju_{1j}σ21σ12\sigma^2_1 モデルのパラメーターを推定したいのですが、Rcommand を使用したいと思います glmmPQL。 式(1)に式(2)と(3)を代入すると、 logit(pij)=γ00+γ10xij+γ01zj+γ11xijzj+u0j+u1jxij…(4)logit(pij)=γ00+γ10xij+γ01zj+γ11xijzj+u0j+u1jxij…(4)\text{logit}(p_{ij})=\gamma_{00}+\gamma_{10}x_{ij}+\gamma_{01}z_j+\gamma_{11}x_{ij}z_j+u_{0j}+u_{1j}x_{ij}\ldots (4) 30のグループと各グループに5つの個人があります。(j=1,...,30)(j=1,...,30)(j=1,...,30) Rコード: #Simulating data from multilevel logistic distribution library(mvtnorm) set.seed(1234) J <- 30 ## number of groups n_j <- rep(5,J) ## number of individuals in jth group N <- sum(n_j) g_00 <- -1 g_01 …

2
混合効果モデルの「分散成分パラメーター」とは何ですか?
混合効果モデルに関するベイツの本の 12ページで、彼はモデルを次のように説明しています。 スクリーンショットの終わり近くで、彼は 相対共分散係数 に応じて、分散成分パラメータ、θΛθΛθ\Lambda_{\theta}θθ\theta 正確に関係を説明せずに。我々が与えられていると言うどのように我々は導き出すだろう、Λのθ、それから?θθ\thetaΛθΛθ\Lambda_{\theta} 関連するノートでは、これはベイツの説明が少し詳細に欠けていると私が思う多くの例の1つです。パラメータ推定の最適化プロセスとテスト統計の分布の証明を実際に通過するより良いテキストはありますか?

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


2
階層的クラスタリングが有効であるためには、距離が「メトリック」である必要がありますか?
N個のアイテム間の距離をmetricではないものと定義するとします。 この距離に基づいて、次に凝集階層的クラスタリングを使用します。 既知の各アルゴリズム(単一/最大/平均リンクなど)を使用して、意味のある結果を取得できますか?または別の言い方をすると、距離がメトリックでない場合にそれらを使用することの問題は何ですか?


2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
観測値が1つしかない被験者との混合モデルをフィットできますか?
非常に大規模なデータセットを使用しており、個々の場所について長期にわたって繰り返し測定を行っています。一部の場所には10のデータポイントがあり、一部の場所には1つのデータポイントしかない場合があります。混合モデルをフィットさせ、ランダム効果として位置を使用します。私の質問は、データポイントが1つしかない場所を使用できますか(1つのデータだけで回帰直線を作成できないため)、またはそれらの場所を除外する必要がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.