タグ付けされた質問 「change-scores」

5
治療前後のコントロール設計を分析する際のベストプラクティス
次の一般的な設計を想像してください。 100人の参加者が治療グループまたは対照グループにランダムに割り当てられます 従属変数は数値であり、治療の前後に測定されます このようなデータを分析するための3つの明白なオプションは次のとおりです。 混合ANOVAの時間交互作用効果によるグループのテスト IVとして条件、共変量として事前測定値、DVとして事後測定値を使用してANCOVAを実行します。 IVとして条件、DVとして変更前後のスコアでt検定を実行します 質問: そのようなデータを分析する最良の方法は何ですか? あるアプローチを別のアプローチよりも好む理由はありますか?

8
変更スコアに対する独立変数の効果をテストするときに、ベースライン測定値を制御変数として含めることは有効ですか?
OLS回帰を実行しようとしています。 DV:1年にわたる重量の変化(初期重量-終了重量) IV:運動するかどうか。 しかし、体重の多い人は、thinnerせた人よりも運動単位あたりの体重が減るのが妥当と思われます。したがって、制御変数を含めたかったのです。 CV:初期開始重量。 ただし、従属変数ANDを制御変数として計算するために両方で初期重みが使用されるようになりました。 これでいいですか?これはOLSの前提に違反しますか?

1
lmerモデルからの効果の再現性の計算
混合効果モデリングによる測定の再現性(別名信頼性、別名クラス内相関)の計算方法を説明するこの論文に出会ったばかりです。Rコードは次のようになります。 #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

6
部分的にペアリングされたデータと部分的にペアリングされていないデータのt検定
調査員は、いくつかのデータセットの複合分析を作成したいと考えています。一部のデータセットには、治療AとBのペアの観測値があります。他のデータセットには、ペアになっていないAとBのデータがあります。このような部分的にペアになったデータのt検定の適応、または尤度比検定のリファレンスを探しています。私は(今のところ)等分散の正規性を仮定し、Aの母平均は各研究(およびB)でも同じであると仮定します。

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
Zスコアをパーセンタイルスコアに変換する簡単な方法はありますか?
zスコアをパーセンタイルスコアに変換するのに役立つ関数またはRパッケージを知っている人はいますか?最終目標は、回答者のグループをzスコアの高さに基づいて4つのカテゴリに分類またはランク付けすることです(最低スコア20%、最高スコア30%、最高スコア20%)。 何か案は?よろしくお願いします!

1
混合モデルの経時変化に対するベースラインの影響?
いくつかのサンプル内で、混合モデルを使用して、この結果のベースライン値に依存する時間の経過に伴う結果の変化をモデル化することが可能かどうか、またどのように可能かと思っていましたか? たとえば、同じ知識グループが同じグループの人々に5回実行される状況を想像してみてください。質問は常に同じであるため、学生は時間の経過とともに正しい答えを学び、各行政機関でより高いスコアを獲得します。ただし、そもそもスコアが高い人は、スコアが低い人よりも変化が少ないでしょう。したがって、変化率がベースライン値に依存していることは明らかです。 混合モデルでは、一部の学生では他の学生よりも変化が大きいという事実を説明するために、ランダムな切片に加えて時間のランダムな勾配を含めることができることを知っています。しかし、最初の測定値をベースライン共変量(およびその時間との相互作用)として含めることは不可能または意味がないと私は思いますか?いずれにせよ、私には「感じ」られない。しかし、その一方で、固定効果を使用してベースライン値の効果を明示的にモデル化することは不可能だと私の心を揺さぶります。私はこれについて多少混乱していることを認めなければなりません。任意の助けをいただければ幸いです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.