タグ付けされた質問 「intraclass-correlation」

クラス内相関係数(ICC)は、定量値がグループ内で類似または関連付けられている量を測定します。ICCにはいくつかのバージョンと代替の公式が存在します。相関関係は、データセットのクラスター化、評価者間の合意、およびその他の設定を評価するために使用されます。

1
lmerモデルからの効果の再現性の計算
混合効果モデリングによる測定の再現性(別名信頼性、別名クラス内相関)の計算方法を説明するこの論文に出会ったばかりです。Rコードは次のようになります。 #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
相互作用のクラス内相関(ICC)
各サイトの各被験者の測定値があるとします。サブジェクトとサイトの2つの変数は、クラス内相関(ICC)値の計算に関して重要です。通常lmer、Rパッケージの関数を使用lme4して実行します lmer(measurement ~ 1 + (1 | subject) + (1 | site), mydata) ICC値は、上記のモデルの変量効果の分散から取得できます。 しかし、最近私は本当に困惑する論文を読みました。上記の例を使用して、著者は、nlmeパッケージの関数lmeを使用して、論文の3つのICC値を計算しました。論文にはこれ以上の詳細は記載されていません。次の2つの観点から混乱しています。 lmeでICC値を計算する方法は?lmeでこれらの3つのランダム効果(被験者、サイト、およびそれらの相互作用)を指定する方法がわかりません。 主題とサイトの相互作用のためにICCを考慮することは本当に意味がありますか?モデリングまたは理論的な観点から計算できますが、概念的にはこのような相互作用の解釈に問題があります。

1
5人の被験者の100個の測定値が、100人の被験者の5個の測定値よりもはるかに少ない情報を提供することを示す
会議で、私は次の声明を耳にしました。 5人の被験者の100の測定値は、100人の被験者の5つの測定値よりもはるかに少ない情報を提供します。 これが本当であることは明らかですが、数学的にどのように証明できるのか疑問に思っていました...線形混合モデルを使用できると思います。ただし、それらの推定に使用される数学についてはあまり知りません(lmer4LMMおよびGLMMで実行するだけbmrsです)。これが真実である例を教えてください。Rの一部のコードよりも、いくつかの式を使用した回答を希望します。たとえば、正規分布のランダムインターセプトとスロープを持つ線形混合モデルなど、簡単な設定を想定してください。 PS LMMを含まない数学ベースの回答も大丈夫でしょう。LMMは、より多くの被験者からのより少ない測定値が少数の被験者からのより多くの測定値よりも優れている理由を説明するための自然なツールのように思えたため、LMMについて考えました。

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
混合モデルでグループをランダムまたは固定として扱う場合の勾配推定値の大きな不一致
いくつかのモデルパラメーターがいくつかのグループ化因子にわたってランダムに変化すると考えられる場合、ランダム効果(または混合効果)モデルを使用することを理解しています。私は、応答がグループ化因子全体で正規化されて(完全ではないがかなり近い)中心に置かれているが、独立変数xはいかなる方法でも調整されていないモデルに適合することを望んでいます。これにより、次のテスト(作成されたデータを使用)に導かれ、実際に効果があるかどうかを確認しました。ランダムインターセプト(で定義されたグループ間)を使用した1つの混合効果モデルと、固定効果予測子として因子fを使用しfた2つ目の固定効果モデルを実行しました。lmer混合効果モデルと基本関数にRパッケージを使用しましたlm()固定効果モデル用。以下はデータと結果です。 yグループに関係なく、0付近で変化することに注意してください。そして、それxはyグループ内で一貫して変化しますが、y > data y x f 1 -0.5 2 1 2 0.0 3 1 3 0.5 4 1 4 -0.6 -4 2 5 0.0 -3 2 6 0.6 -2 2 7 -0.2 13 3 8 0.1 14 3 9 0.4 15 3 10 -0.5 -15 4 11 -0.1 -14 …

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
複数の変数を持つクラス内相関係数(ICC)
兄弟内のいくつかの変数を測定したと仮定します。兄弟は、家族内にネストされています。データ構造は次のようになります。 家族の兄弟価値 ------ ------- ----- 1 1 y_11 1 2 y_12 2 1 y_21 2 2 y_22 2 3 y_23 ... ... ... 同じ家族内の兄弟で行われた測定値間の相関関係を知りたい。これを行う通常の方法は、ランダム切片モデルに基づいてICCを計算することです。 res <- lme(yij ~ 1, random = ~ 1 | family, data=dat) getVarCov(res)[[1]] / (getVarCov(res)[[1]] + res$s^2) これは次と同等です: res <- gls(yij ~ 1, correlation = corCompSymm(form …

2
同じグループにある2つのランダムに描画されたユニット間の予想される相関としてのICC
マルチレベルモデリングでは、クラス内相関はしばしば変量効果ANOVAから計算されます y私はj= γ00+ あなたj+ e私はjy私j=γ00+あなたはj+e私j y_{ij} = \gamma_{00} + u_j + e_{ij} ここで、はレベル2の残差、はレベル1の残差です。次に、u_jとe_ {ij}の分散についてそれぞれ推定値と\ hat {\ sigma} _e ^ 2を取得し、それらを次の式に代入します。あなたはjあなたはju_je私はje私je_{ij}σ^2あなたはσ^あなたは2\hat{\sigma}_u^2σ^2eσ^e2\hat{\sigma}_e^2あなたはjあなたはju_je私はje私je_{ij} ρ = σ^2あなたはσ^2あなたは+ σ^2eρ=σ^あなたは2σ^あなたは2+σ^e2 ρ = \frac{\hat{\sigma}_u^2}{\hat{\sigma}_u^2 +\hat{\sigma}_e^2} Hox(2002)はp15に次のように書いています。 クラス内相関ρは、同じグループ内にある2つのランダムに描画されたユニット間の予想される相関としても解釈できます。 質問がありますここで(それは、この代わりにほぼ等しいのとまったく同じである理由)高度な質問をし、先進的な答えを取得します。 ただし、もっと簡単な質問をしたいと思います。 質問:同じグループ内にある2つのランダムに描かれたユニット間の相関について話すことはどういう意味ですか? クラス内相関はペアのデータではなくグループで機能するという事実を基本的に理解しています。ただし、同じグループからランダムに描画された2つのユニットのみが相関関係を計算する方法を理解できません。たとえば、WikipediaページのICCのドットプロットを見ると、複数のグループと各グループ内の複数のポイントがあります。

2
相関係数の比較
2つのデータセットがあり、78と35のサンプルで約250.000の値があります。一部のサンプルは家族の一員であり、これはデータに影響を与える可能性があります。ペアワイズ相関を計算しましたが、0.7と0.95の間で変動しますが、ファミリー内とファミリー間で相関係数に有意差があるかどうか知りたいのですが?これを行う最良の方法は何ですか?ありがとう

1
ランダムな勾配を持つ混合モデルのクラス内相関係数
私は、次のモデル持っているm_plot装備lme4::lmerの参加者のために渡ったランダム効果(とlfdn()と項目をcontent): Random effects: Groups Name Variance Std.Dev. Corr lfdn (Intercept) 172.173 13.121 role1 62.351 7.896 0.03 inference1 24.640 4.964 0.08 -0.30 inference2 52.366 7.236 -0.05 0.17 -0.83 inference3 21.295 4.615 -0.03 0.22 0.86 -0.77 content (Intercept) 23.872 4.886 role1 2.497 1.580 -1.00 inference1 18.929 4.351 0.52 -0.52 inference2 14.716 3.836 …

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
クラス内相関係数対F検定(一元配置分散分析)?
クラス内相関係数と一元配置分散分析について少し混乱しています。私が理解しているように、どちらも、グループ内の観測値が他のグループの観測値とどの程度類似しているかを示しています。 誰かがこれをもう少しよく説明できますか、そしておそらく各方法がより有利である状況を説明できますか?

1
異なるグループの再現性(ICC)を比較する方法は?
2つのグループのICC値を計算しました。次に、ICC値を比較して、グループの再現性が異なるかどうかを判断します。文献では、人々は単に再現性を比較するためにt検定を使用しましたが、これを行う方法は私には不明確です。 たとえば、ダミーデータの場合: ID gr day behaviour 1 1 1 0.361 2 1 1 0.232 3 1 1 0.240 4 1 1 0.693 5 1 1 0.483 6 1 1 0.267 7 2 1 0.180 8 2 1 0.515 9 2 1 0.485 10 2 1 0.567 11 2 1 0.000 …

1
複数の評価者、参加者ごとに異なる評価者、および経時変化の可能性がある評価者間信頼性を実行する方法は?
参加者は2回評価され、2つの評価は3年で区切られていました。ほとんどの参加者について、評価は異なる評価者によって行われましたが、一部(10%未満)では、同じ評価者が両方の評価を行いました。合計8人の評価者がおり、2つの評価者が両方の時点で評価を行っていました。 さて、評価は仮想の「正しい」値を持つ能力の側面のものだったので、評価者間の絶対的な合意は一貫性よりも重要です。ただし、評価は3年間隔で行われたため、能力に実際の変更があった可能性があります(おそらく変更されていました)。 この場合、信頼性の最良のテストは何でしょうか? 私はクラス内相関に傾いていますが、ICC1はこれらのデータで実行できる最善の方法ですか?

3
クラス内の相関と集約
想像してみろ: それぞれに10メンバーの1000チームのサンプルがあります。 信頼できる複数項目の数値スケールを使用して、チームが機能していると各チームメンバーにどれだけ考えているかを尋ねて、チームの機能を測定しました。 チームの有効性の測定が、チームメンバーの特異な信念の特性であるか、またはチームに関する共有された信念の特性である範囲を説明する必要があります。 この状況および関連する状況(組織への集計など)では、多くの研究者がクラス内相関を報告します(たとえば、Campion&Medskerの表1、1993)。したがって、私の質問は次のとおりです。 クラス内相関のさまざまな値にどの説明ラベルを付けますか?つまり、クラス内相関の値を次のような定性的な言語に実際に関連付けることを目的としています。 クラス内相関は適切な統計だと思いますか、それとも別の戦略を使用しますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.