クロスオーバー(ペア)実験のエラーバーを表示する方法


19

次のシナリオは、調査担当者(I)、校閲者/編集者(R、CRANとは無関係)、およびプロット作成者としての私(M)のトリオで最もよくある質問になりました。(R)は、各プロットがエラーバーを持たなければならないことだけを知っている典型的な医療大ボスレビューアであると仮定できます。そうでなければ、それは間違っています。統計レビューアが関与している場合、問題はそれほど重大ではありません。

シナリオ

典型的な薬理学的クロスオーバー研究では、2つの薬物AとBがグルコースレベルへの影響についてテストされます。各患者は、キャリーオーバーがないという仮定の下で、ランダムな順序で2回テストされます。主要エンドポイントはグルコース(BA)の違いであり、対応のあるt検定が適切であると想定しています。

(I)両方の場合の絶対グルコースレベルを示すプロットが必要です。彼は(R)のエラーバーに対する欲求を恐れ、棒グラフの標準エラーを求めます。ここで棒グラフ戦争を始めないでください。

2つの治療に対する棒グラフとSEグルコース

(I):それは真実ではない。バーは重なり、p = 0.03?それは私が高校で学んだことではありません。

(M):ここにはペアのデザインがあります。要求されたエラーバーは完全に無関係です。重要なのは、プロットに示されていないペアの差のSE / CIです。選択肢があり、データが多すぎない場合は、次のプロットを選択します

結合された線はペアリングを示し、ドットは元の値を示します

追加1:これは、いくつかの応答で言及された平行座標プロットです

(M):線はペアリングを示し、ほとんどの線が上昇します。勾配が重要なので正しい印象です(わかりました、これはカテゴリですが、それでもなお)。

(I):その写真は紛らわしいです。誰もそれを理解しておらず、エラーバーもありません(Rは潜んでいます)。

(M):差の関連する信頼区間を示す別のプロットを追加することもできます。ゼロラインからの距離は、効果の大きさの印象を与えます。

(I):誰もやらない

(R):そして貴重な木を無駄にします

(M):(良いドイツ人として):はい、木の上のポイントが取られます。ただし、複数の治療法と複数のコントラストがある場合は、これを使用します(公開することはありません)。

差の信頼区間

提案はありますか?プロットを作成する場合、Rコードは以下のとおりです。

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

よろしくお願いします@ dieter-menne、すばらしい質問です!それはあなたが記事を提出する雑誌の種類にとても依存しています。私はグラフ戦争から遠ざかりますが、私はグラフ2と3が大好きです。非常に小さなスペースに多くの情報があります。
-doug.numbers

4
Masson and Loftus(2003)は、しばしば参考文献です。それらは、同じグラフの2番目のパネルに差のCIをパネリングするプロットの例を示しています。それがサーカスのみんなを幸せにするかどうかわからない(私はあなたのために感じる!)
アンディW

参照してくれてありがとう、@ AndyW。それは要点ですが、問題があります:それは心理学からです。医学の評論家と比較して統計的背景がはるかに優れている心理学者からの主題に関する多くの良い論文があります。このテーマに関する上位のジャーナルのガイドを見つけてほしいと思います。それが私が扱える唯一の鋭い剣です。
ディーターメンネ

回答:


17

平均の標準誤差を表す誤差範囲は、被験者内の設計にはまったく不適切であるという仮定は完全に正しいです。ただし、エラーバーと重要性の重複の問題は、別のトピックです。このコメント付きリファレンスリストの最後に戻ります。

被験者内の信頼区間またはエラーバーに関する心理学の豊富な文献があります。参照作業は明らかに次のとおりです。

ロフタス、GR、およびマッソン、MEJ(1994)。被験者内設計での信頼区間の使用Psychonomic Bulletin&Review、1(4)、476–490。土井:10.3758 / BF03210951

しかし、彼らの問題は、被験者内因子のすべてのレベルに対して同じエラー項を使用することです。これは、あなたのケースでは大きな問題ではないようです(2レベル)。しかし、この問題を解決するより新しいアプローチがあります。最も注目すべきは:

Franz、V.、&Loftus、G.(2012)。被験者内設計の標準誤差と信頼区間:Loftus and Masson(1994)を一般化し、代替アカウントのバイアスを回避します心理学速報&レビュー、1–10。doi:10.3758 / s13423-012-0230-1

Baguley、T.(2011)。ANOVAの被験者内信頼区間の計算とグラフ化。行動研究方法。doi:10.3758 / s13428-011-0123-7 [ ここにあります ]

詳細については、後者の2つの論文を参照してください(どちらも読む価値があると思います)。


研究者はCIをどのように解釈しますか?次の論文によると悪い:

ベリア、S。、フィドラー、F。、ウィリアムズ、J。、およびカミング、G。(2005)。研究者は、信頼区間と標準誤差範囲を誤解しています。心理的方法、10(4)、389–396。doi:10.1037 / 1082-989X.10.4.389

重複するCIと重複しないCIをどのように解釈する必要がありますか?

カミング、G。、&フィンチ、S。(2005)。目で推論:信頼区間とどのようにデータの読み出し写真へアメリカの心理学者、60(2)、170–180。doi:10.1037 / 0003-066X.60.2.170


最後の1つの考え(これはあなたのケースには関係ありませんが):1つのプロットに分割プロット設計(つまり、被験者内因子と被験者間因子)がある場合、エラーバーを一緒に忘れることができます。raw.means.plotRパッケージの関数を(謙虚に)推奨しますplotrix


2
非常に便利な参照リスト。カミングは、amazon.com / Understanding
Statistics


@amoeba私が引用したバグリー紙は、モリー紙の技法を使用しています。
ヘンリック

10

質問は、ペアのデータをプロットする最良の方法ほどエラーバーに関するものではないようです。

本質的に、ここでのエラーバーはせいぜい不確実性を要約する方法です:データの微細構造については多くのことを言っていないし、必ずしもそうすることはできません。

質問では、平行座標プロット(プロファイルプロットとも呼ばれ、異なる分野で異なることを意味する用語)が言及されています。基本的な散布図は、@ Ray Koopmanによってすでに提案されています。

AB(A+B)/2A+B

このプロットの別の情報源は、ネイマン、J。、スコット、EL、およびシェーン、CD 1953です。銀河の空間分布について:特定のモデル。Astrophysical Journal 117:92–133。

大まかに言って、このようなプロットは、Tukeyと彼の義理の兄弟Anscombeによって一般化された、残差と適合のプロットの考え方に似ています。

AB=0A=BAB

無視された設計は、1992年DRのMcNeilの平行線プロットです。ペアデータのグラフ化について。アメリカ統計学者 46:307–310。これについては、以下の2つのリファレンスでも説明しています。

Stataにリンクされたレビューは、いくつかの参照とともに、

2004年、グラフ作成の同意と不一致。Stata Journal 4:329-349。

http://www.stata-journal.com/sjpdf.html?articlenum=gr0005でアクセス可能な.pdf

変更、相関、およびその他の比較のためのペア、平行、またはプロファイルプロット。Stata Journal 9:621-639。

http://www.stata-journal.com/sjpdf.html?articlenum=gr0041でアクセス可能な.pdf

Stata以外のユーザーは、自分のお気に入りのソフトウェアでグラフを実装する方法を考えながら、Stataコードをスキップしてハミングすることができます。

AB


4

個々の(A、B)ポイントの散布図を試してください。それらのほとんどは、対角線(A = B線)の片側のみにあるはずです。エラーバーには2つの類似物があります。平均差のCIに相当する従来のものは、平均差の信頼帯になります。バンドは、両方の対角線に平行な2本の線の間の領域になります。対のt検定は、バンドの両方のエッジが対角線の同じ側にある場合にのみ重要です。

より保守的なエラーバーアナログは、重心の信頼楕円です。


1
cmethodBcmethodA

いいえ、cl。-:)臨床化学は洗練されすぎています。「そこ」に参照を追加した可能性があります。あなたがどんな紙について話しているのか分かりません。
ディーターメンネ

4

予備的な要約:

Masson / Loftusは非常に網羅的であり、「相互作用」のようなものを受け入れない医療関係者に与えるのは容易ではありません。また、多重比較に関するいくつかの提案もあります。これは、ペアごとの信頼区間は、大幅に単純化したくない場合に説明するのが難しいことを示しています。

マッソンロフタス

私はこのスタイルが好きではありません。エラーバーのあるバーは、最後の千年のように見えます。しかし、彼らはまた、わずかによりエレガントなスタイルを使用しています:

バーなしのマッソンロフタス

カミング/フィンチベリア等。必読です。1つ目は、相互作用という言葉を見たときに身震いする友人に与える完璧な選択です。私はその記事を読んだ後にカミングの本を注文しました。2番目は 、次回の医学研究者会議のためにShinyで実施するテストを示しています。

カミング/フィンチ

以前に使用したことのない2番目の軸があったとしても、このプロットは気に入っています。それを取得するためのRベースのグラフィックスメソッドについては、Henrikと他のStackOverflowの貢献を確認してください。値の変化を完全に明確にするために、差の左側に2番目の軸を配置し、p値軸を追加することをお勧めします。

ラティス/ ggplotフラクションの誰かがショットを取っていますか?提供されるすべてのソリューションは、基本的なグラフィックであり、パネル化可能/ファセット可能ではありません。

ただし、コメントと論文の大部分は心理学部門(およびハードコア化学の@cbeleite)からのものです。医学雑誌の査読者からコメントを得ることは良いことです。


0

なぜ各患者の差*をプロットしないのですか?次に、ヒストグラム、ボックスプロット、または通常の確率プロットを使用して、差の95%信頼区間を重ねることができます。

  • いくつかのシナリオでは、対数の違いかもしれません。たとえば、Patterson&Jones、「臨床薬理学における生物学的同等性と統計」、Chapman、2006年を参照してください。

何故なの?有効な情報を提供するかもしれませんが、個々のポイントまたはペアのプロットは、医学研究ではあまり人気がありません。これが、(より多くの情報を提供する)並列プロットがあまり人気がない理由です。医学研究者は、平均と「正常範囲」(それが何であれ)を望んでいます。
ディーターメンネ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.