が小さい


14

4つの異なる時点(治療前、治療終了日、治療終了後4週間、治療終了後2〜4か月)での鉄レベルに対する治療の効果を調べる研究のために分析するデータが与えられました。制御グループはありません。彼らは、治療前(ベースライン)レベルまでの3つの治療後の時点のそれぞれで鉄レベルの有意な増加があるかどうかを探しています。11人の患者はベースラインレベルを持ちましたが、4つの時点すべてについて完全なデータを持っていた患者は8人だけでした(各時点でn = 11、10、9、および8)。鉄のレベルが測定されただけでなく、ベースラインと比較するために、各時点で2つの実験室測定が行われました。

これを分析する方法についていくつか質問があります。このデータを分析するにはRM ANOVAが適切だと最初に思いましたが、サンプルサイズが小さいこと、データの損失、データの非正規分布が心配でした。次に、ウィルコクソンの符号付きランク検定を使用して、各治療後の測定値をベースラインと比較することを検討しましたが、その後、多重比較の問題に遭遇しました。ただし、複数の比較を実行する必要があると軽視している文献をいくつか読みました。全体として、私は小さなサンプルサイズ、不完全なデータ、多重比較(および必要かどうか)を扱っています。

これがすべて理にかなっていることを望みます。私はCrossValidatedを初めて使用し、経験豊富な統計学者から学ぶための場所として同僚から指示されたので、アドバイスをいただければ幸いです。ありがとう!


コメントから生データを追加するように編集:

合計4つの時点があり、結果変数は連続的です。たとえば、各時点での結果は次のようになります。

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

1
再現可能なサンプル(または生データ)を追加すると便利です。
ラディスラフナオ

結果変数は連続的です。たとえば、各時点での結果は次のようになります。ベースラインレベルn = 11:[2、7、7、3、6、3、2、4、4、3、14]。1番目の投稿n = 10 [167、200、45、132、。、245、199、177、134、298、111]。2番目の投稿n = 9 [75、43、23、98、87、。、300、。、118、202、156]。3番目の投稿レベルn = 8 [23、34、98、112、。、200、。、156、54、18、。] 合計4つの時点があります。
msturm17

回答:


5

私はあなたの問題を再考しましたが、フリードマンのテストは、反復測定による一元配置分散分析のノンパラメトリックバージョンです

あなたにいくつかの基本的なスキルがあることを望みますR

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

テストフリードマンのテストを実行...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

次に、ノンパラメトリック事後検定により、どのグループ間で違いが存在するかを見つけます。ここにすべての可能な比較があります。

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

ご覧のように、ベースライン(最初の時点)のみが他と統計的に異なります。

これがあなたのお役に立てば幸いです。


1
ラディスラフ、これはこの質問に対する優れた答えです。非常に徹底的かつ完全です。私が見る唯一の問題は、クラスカル・ワリスの分散分析にも観測の独立性の仮定があるということです。そのため、独立変数の各レベルに異なる主題があります。 4つの時点にわたる患者。これについて意見がありますか、またはこの問題に対処する他の方法を考えていますか?本当にありがとう!
マットライヘンバッハ

上記のコメントを削除しました。私は最終的により良いテストを見つけました。楽しい !
ラディスラフナオ

これは私の最初の質問ではありません@ msturm17、あなたの答えを受け入れなければなりません、私はあなたに賞金を与えました!
マットライヘンバッハ

ラディスラフ、私の質問に完全に答えてくれてありがとう!
msturm17

2

経時的な個々の変化の分布がわからない場合は、患者間の差の分布で近似することはできません。たとえば、治療前と治療後(520,530、...、610)にそれぞれ鉄レベル(510,520、...、600)の患者が10人いる場合、Kruskal-Wallis ANOVA(または他の同様のアルゴリズム)は主張します鉄のレベルに大きな変化がないこと。

私見、コントロールグループなしで、あなたができる最善のことは、何人の患者が鉄レベルを増加させ、何人がそれを減少させたかをカウントし、この重要性をテストすることです。

とはいえ、KW ANOVAから有意な鉄分レベルがあると言われた場合、それは(誤検知なし)です。


1
誤検知なし ハハ、答えてくれてありがとう。何人の患者が鉄レベルを増加させ、何人がそれを減少させたかをカウントすることに関して、「これの重要性をテストする」ことをどのように提案しますか?ありがとう!
マットライヘンバッハ

2
mnp=2m+nk=0mm+nk

ありがとうございました!これは私の質問を見るための別の興味深い方法であり、それが私のデータにどのように適用されるかを見るでしょう。
msturm17
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.