タグ付けされた質問 「repeated-measures」

同じユニット(被験者など)で複数の測定が収集されると、繰り返し測定データが発生します。このタグは[anova]タグと一緒にRM-ANOVAに使用します。

1
Rの反復測定ANOVAでエラー項を記述する方法:Error(subject)vs Error(subject / time)
私の質問は、Rの反復測定ANOVAでError()項を指定する以前の投稿に非常に密接に関連してい ます。ただし、エラー項を定義する方法について、もっと洞察を得たいと思います。 私が双方向反復ANOVAを持っているとします。グループ効果間の要因は治療(対照vsプラセボ)ですが、時間は4回(T1〜T4)を繰り返し測定したグループ内効果です。患者IDは件名として記録されます。ここでは、http://gjkerns.github.io/R/2012/01/20/power-sample-size.htmlのチュートリアルの例からデータを借りた ので、データは次のようになります。 Time Subject Method NDI 0min 1 Treat 51.01078 15min 1 Treat 47.12314 48hrs 1 Treat 26.63542 96hrs 1 Treat 20.78196 0min 2 Treat 42.61345 15min 2 Treat 32.77171 分散分析を適用するには: aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData) summary(aovComp) Error: Subject Df Sum Sq Mean Sq F …


2
Rのcoxph()は繰り返し測定をどのように処理しますか?
環境 Rのcoxph()が被験者(または患者/顧客)の繰り返しエントリをどのように受け入れて処理するかを理解しようとしています。これをロングフォーマットと呼ぶ人もいれば、「反復測定」と呼ぶ人もいます。 たとえば、次のAnswersセクションのID列を含むデータセットを参照してください。 時変共変量を含むCoxモデルに最適なパッケージ また、共変量は全体にわたって時変であり、バイナリである検閲(つまりイベント)変数が1つだけあると仮定します。 ご質問 1)上記のリンクの回答で、coxph()の呼び出しでパラメーターとしてIDが指定されていない場合、結果はcoxph()のパラメーターとしてcluster(ID)を含めるのと同じですか? ドキュメントを検索しようとしましたが、(1)に明確に対処していないようです:https : //stat.ethz.ch/pipermail/r-help//2013-July/357466.html 2)(1)の答えが「いいえ」の場合、(数学的に)なぜですか?coxph()のcluster()は、pgのサブセクション 'cluster'に従って被験者間の相関を求めているようです。20時 https://cran.r-project.org/web/packages/survival/survival.pdf 3)あいまいな質問:反復測定のあるcoxph()は、Rのfrailtypack回帰法とどのように比較されますか? 補遺 cluster(ID)の使用に関する以下のヒント: ログランクテストの繰り返し測定対応バージョンはありますか? 同様に: https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html GEEアプローチ:coxphのモデルステートメントに「+ cluster(subject)」を追加混合モデルアプローチ:coxmeのモデルステートメントに「+(1 | subject)」を追加します。 前もって感謝します!

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
Rでの反復測定ANOVAでのError()項の指定
Rでの2方向反復測定分散分析の誤差項の定義に問題があります。私のデータは、木から抽出されたコアに沿った3つの半径方向位置(内側、中央、および外側)の木材密度推定から構成されています。合計20の木の種、各種の6個体、および各木からの2つのコアがあります。 半径方向の位置が木材の密度に及ぼす影響をテストするために、個人間のばらつきを説明する誤差項を含む次の2元配置分散分析モデルを使用します。 radpos.aov <- aov(WD ~ Species*Radialposition + Error(Individual), data=Radpos) ただし、エラー項の指定が適切かどうかはわかりません。コア内の変動性も考慮する必要がありますか?私にとって、この変動性は、私が興味を持っている主な要因である放射状の位置による変動と同じです。 繰り返し測定ANOVAでの誤差項の指定について読むことに少し時間を費やしましたが、実際には誤差項の指定に問題があります。私はこれでいくつかの助けに感謝します。

1
R線形回帰のカテゴリ変数「非表示」の値
これは私が何度か遭遇した例にすぎないため、サンプルデータはありません。Rで線形回帰モデルを実行する: a.lm = lm(Y ~ x1 + x2) x1は連続変数です。x2カテゴリ型で、「低」、「中」、「高」の3つの値があります。ただし、Rによって与えられる出力は次のようになります。 summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 私は、Rがそのような要因(要因x2であること)に何らかのダミーコーディングを導入していることを理解しています。私はただ疑問に思っていx2ます。「高」の値をどのように解釈しますか?たとえば、ここで示した例の「High」x2は応答変数にどのような影響を与えますか? これの例を他の場所(例:ここ)で見ましたが、理解できる説明は見つかりませんでした。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
各被験者ごとに複数のデータポイントを正しく処理する方法
私は現在、各被験者の複数の測定値を含むデータを正しく処理する方法についてsomeoeと議論しています。この場合、各被験者のさまざまな状態について、短時間で各被験者のデータが収集されました。すべての測定値は、正確に同じ変数を収集します。 現在の1つのオプションは、データを条件ごとにグループ化することであり、複数のデータポイントが1つの対象からのものであることを気にしないことです。ただし、各被験者のデータポイントはおそらく完全に独立しているわけではありません。 他の選択肢は、最初に各被験者から各状態のすべての測定値の平均を取り、次に平均を比較することです。ただし、最終分析では平均の誤差が少ないことが考慮されないため、これはおそらく重要性に影響を与えます。 どのようにしてそのようなデータを正しく分析できますか?これはSPSSで何らかの形で処理されますか?原則として、平均を計算するときに、最終的な分析でこれを考慮するよりも、エラーマージンを計算することは可能ですが、SPSSが何らかの形でこの計算を背後で行っているとは思いません。

3
複数の表面接触後に指で拾った細菌:非正常データ、反復測定、交差した参加者
はじめに 2つの条件(A =手袋を着用、B =手袋を着用しない)で、汚染された表面に大腸菌を繰り返し接触している参加者がいます。手袋をした場合と使用しない場合の指先の細菌の量に違いがあるかどうか、また接触の数に違いがあるかどうかを知りたいです。どちらの要素も参加者内にあります。 実験方法: 参加者(n = 35)は、同じ指で各正方形に1回タッチして、最大8つのコンタクトを作成します(図aを参照)。 次に、参加者の指を拭いて、接触するたびに指先の細菌を測定します。次に、新しい指を使用して、1〜8個の接点など、さまざまな数の表面に触れます(図bを参照)。 これが実際のデータです。実際のデータ データは正常ではないため、下のバクテリアの分布| NumberContactsを参照してください。x =細菌。各ファセットは異なる数の連絡先です。 モデル NumberContactsにGamma(link = "log")と多項式を使用してアメーバの提案に基づいてlme4 :: glmerから試してみます。 cfug<-glmer(CFU ~ Gloves + poly(NumberContacts,2) + (-1+NumberContacts|Participant), data=(K,CFU<4E5), family=Gamma(link="log") ) plot(cfug) NB。GIRA(link = "inverse")は、PIRLSのステップを半分にしても逸脱を減らすことができなかったとは言いません。 結果: cfugの近似vs残差 qqp(resid(cfug)) 質問: 私のglmerモデルは、各参加者のランダムな効果と、誰もが実験Aに続いて実験Bを行うという事実を組み込むように適切に定義されていますか? 添加: 参加者間には自己相関があるようです。これはおそらく、それらが同じ日にテストされなかったためであり、細菌のフラスコは時間とともに成長し、減少します。それは重要ですか? acf(CFU、lag = 35)は、ある参加者と次の参加者の間の有意な相関を示しています。

4
2つの製品を区別する統計テストを開発する
顧客調査からのデータセットがあります。製品1と製品2の間に有意差があるかどうかを確認するために統計テストを展開したいと思います。 これは、顧客のレビューのデータセットです。 料金は非常に悪い、悪い、いい、良い、とても良いからです。 customer product1 product2 1 very good very bad 2 good bad 3 okay bad 4 very good okay 5 bad very good 6 okay good 7 bad okay 8 very good very bad 9 good good 10 good very good 11 okay okay 12 very good good …

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
難しいデータセットのモデルは何ですか?(ネスティングの多い数百の時系列)
分析するのに非常に複雑なデータセットがあり、それに対する適切な解決策を見つけることができません。 ここに事があります: 1.生データは本質的に昆虫の歌の録音です。各曲はいくつかのバーストで構成され、各バーストはサブユニットで構成されています。すべての個人が5分間記録されました。バーストの数と記録内でのそれらの位置、およびバーストごとのサブユニットの数は、個人間で非常に異なる場合があります。 2.各サブユニットのキャリア周波数(基本周波数)がわかっているので、それを分析します。 私の問題: 1.バースト内の周波数は明らかに独立していません(かなり安定していますが、サブユニットn-1の周波数はサブユニットnに影響します)。 2.バーストは、録音内でも独立していません。 3.時間とともに周波数が下がるので、それらの独立性はさらに低くなります(個人が歌うのに飽きて、曲の周波数がどんどん低くなります)。落ち込みは直線的なようです。 4.ネスト= 2つの場所AとBに3つの複製された母集団があります。したがって、A1、A2、A3とB1、B2、B3があります。 私がしたいこと: 1. 2つの場所の頻度の違いを特徴付ける(統計的にテストする) 2. 2つの場所の間で落ちる周波数を特徴付けます(それらの1つで速く落ちるかどうかを確認してください)。 どうやってするの: それが私が助けを必要とする理由です:私にはわかりません。私のケースは、通常一緒に見られない問題を組み合わせているようです。私は混合モデル、GAM、ARIMA、ランダム効果と固定効果について読みましたが、それを行うための最良の方法を本当に確信できません。しかし、それをグラフ化すると(頻度〜サブユニット番号n)、2つの場所の違いは非常に明確です。温度(周波数を高くする)など、他の変数も考慮する必要があります。 私は考えました: レプリケート内の個人を入れ子にし、複製を場所(個人/複製/場所)内に入れ子にします。 ランダムな「バースト」効果を使用して、各バースト内の変動を考慮します。 固定された「記録中のバースト位置」効果を使用して、周波数の低下を測定します(実際には線形であることを期待しています)。 正しいでしょうか? このようなシナリオに使用できる特別なタイプのモデルはありますか?

2
Rで反復測定多変量結果をシミュレートするにはどうすればよいですか?
@whuberは、1つの時点で多変量結果(、y_2、y_3)をシミュレートする方法を示しました。y 2 y 3y1y1y_1y2y2y_2y3y3y_3 私たちが知っているように、縦断的データはしばしば医学研究で発生します。私の質問は、Rの反復測定多変量結果をシミュレートする方法ですか?たとえば、2つの異なる治療グループの5 つのさまざまな時点でy1y1y_1、y2y2y_2、およびy_3を繰り返し測定しy3y3y_3ます。


2
SPSS出力を正しく解釈するための反復測定ANOVA仮定の理解
さまざまな報酬条件がタスクのパフォーマンスに影響を与える可能性があるかどうかを調査しています。それぞれn = 20の2つのグループによる小規模な研究のデータがあります。3つの異なる「報酬」条件でのパフォーマンスに関連するタスクのデータを収集しました。タスクには、3つの条件のそれぞれにおけるパフォーマンスが2回、ランダムな順序で含まれていました。異なる「報酬」条件のそれぞれで、各グループのタスクパフォ​​ーマンスに平均差があるかどうかを確認したいと思います。 IV =グループタイプ DV = 3つの条件にわたるタスクパフォ​​ーマンスの平均測定値 反復測定ANOVAからの出力とSPSSの生データセットへのアクセスがありますが、続行方法がわかりません。Pallantのテキストは多少制限されているため、この解釈の段階的なガイドを見つけることができませんでした。私の特定の問題は次の分野にあります: 各変数の正常性を個別に、またはIVの各レベルの組み合わせ内でチェックしますか?それが組み合わせ内にある場合、それをどのようにチェックしますか? 最初にモークリーのテストをチェックしますか?違反している場合、それはどういう意味ですか?違反していない場合、それはどういう意味ですか? 多変量テストの表、または被験者内効果のテストをいつ見ても大丈夫ですか?どちらか(または両方?)を使用するのが適切かどうかはわかりません。 ペアワイズ比較を見ても大丈夫ですか?多変量または被験者内効果が有意性を示さない場合(つまり、P <0.05)、そうすることは直観に反するように見えますが、私は再び確信が持てません。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.