臨床試験が早期に終了したときにバイアスが影響を受けるのはなぜですか?


24

中間解析は、おそらく初期の研究を終了する前に1つの以上の時点でのデータの分析を意図して研究の公式近い、例えば、あります。

Piantadosi、S.(臨床試験-方法論的観点)によると:「治験が早期に終了した場合、治療効果の推定値は偏ります。決定が早ければ早いほど、偏りが大きくなります。

この主張を説明してもらえますか。精度が影響を受けることは簡単に理解できますが、バイアスに関する主張は私には明らかではありません...


私は、これはベイズとFrequentist方法論の違いを「肉付け」に完璧な質問だと思う
probabilityislogic

回答:


13

まず、コンテキストに注意する必要があります。これは、何らかのランダムな外部の理由ではなく、有効性/無益性を示す中間モニタリングのために試験が早期に停止した場合にのみ適用されます。その場合、効果サイズの推定値は完全に統計的な意味で偏ります。有効性のために停止した場合、推定効果は高すぎます(正の場合)、無益のために停止した場合、低すぎます。

Piantodosiは直感的な説明も提供します(私のエディションの10.5.4項)。2つの平均の真の差が1ユニットであるとします。多くの試行を実行し、中間分析時にそれらを見ると、それらのいくつかは、1をはるかに超える、1をはるかに下回る、1を中心とする効果サイズを観測します-分布は広くなりますが、対称的です。この時点で推定される効果の大きさはそれほど正確ではありませんが、公平です。ただし、差が大きい場合(複数のテスト用に調整)、つまり推定値が高い場合にのみ、エフェクトサイズを停止して報告します。それ以外の場合はすべて続行し、見積もりを報告しません。それは、早期に停止したこと条件とすることを意味します、効果サイズの分布は対称ではなく、その期待値は推定の真の値を超えています。

この効果が早い段階でより深刻であるという事実は、試行を停止するためのより大きなハードル、したがって、調整の間に分布の大部分が捨てられることに起因しています。


1
最初はこれも考えましたが、それを証明するために座ったとき、私はできませんでした。結果の推定値が実際に公平であることを示すことができました (新しい直感:条件付き停止からの正のバイアスは、実験を完了するまでの負のバイアスとバランスをとります。)では、より厳密なデモンストレーションを提示できますか?
whuber

@whuber私はそれを書き上げようとしますが、ポイントは、Piantodosiの声明は、あなた早期に停止したときに何が起こるかについてのみであるということです。バランスを取るための完了はありません。
アニコ

2
@whuberはい、それも元のステートメントが主張していることです。調査を完了することを条件とする反対のバイアスがあるというあなたのポイントも有効です。全体的なメッセージは、暫定的な監視を開始すると、効果の大きさを推定する能力に面白いことが起こり始めるということです。
アニコ

3
@Aniko早期終了が発生した場合、バイアスを調整することができるはずです。そのため、条件付きで終了する実験で、固定サイズのランダムサンプルを対象とする標準的な推定器の単純な使用について議論しているようです。(ところで、+ 1。)
whuber

2
@whuberもちろん、このバイアスを調整できますが、最初に存在することを認識する必要があります。そして、10人の患者のうち5人が明らかに応答したにもかかわらず、早期停止によるバイアスを調整した後の推定応答率は40%(数字で構成)であることを調査者に販売する必要があります。
アニコ

3

結論にバイアスが生じる可能性のある理由と、それが完全なストーリーではない理由を以下に示します。プラス(+1)の効果が期待されるが、マイナスの効果(-1)が期待される薬物の連続試験があるとします。5匹のモルモットを次々にテストします。単一のケースにおける肯定的な結果の未知の確率は、実際にはおよび否定的な結果13414

したがって、5回の試行の後、異なる結果の確率は

 Outcome     Probability
+5-0 = +5    243/1024
+4-1 = +3    405/1024
+3-2 = +1    270/1024
+2-3 = -1     90/1024
+1-4 = -3     15/1024
+0-5 = -5      1/1024

したがって、全体として肯定的な結果の確率は918/1024 = 0.896であり、平均の結果は+2.5です。5回の試行で割ると、これは1回の試行あたり平均+0.5の結果です。

それもあるように、それは、公平な図である+1×341×14

モルモットを保護するために、いずれかの段階で累積結果が陰性である場合、研究は終了するとします。その後、確率は

 Outcome     Probability
+5-0 = +5    243/1024
+4-1 = +3    324/1024
+3-2 = +1    135/1024
+2-3 = -1     18/1024
+1-2 = -1     48/1024
+0-1 = -1    256/1024

したがって、全体として肯定的な結果の確率は702/1024 = 0.6855であり、平均の結果は+1.953です。前の計算で試行ごとの結果の平均値を調べた場合、つまり+ 5を使用した場合+3+55+1+351+15115および113場合、+ 0.184になります。11

これらは、2番目のスキームで早期に停止することによってバイアスがあり、バイアスが予測される方向にあるという感覚です。しかし、それは完全な話ではありません。

なぜwhuberとprobabilityislogicは、早期に停止することで公平な結果が得られると考えるのか 2番目のスキームでの試験の予想結果は+1.953です。予想される試行回数は3.906回です。したがって、一方をもう一方で割ると、以前とまったく同じように+0.5が得られ、偏りがないと説明されました。


あなたは「プレデータ」世界の視点を取っています。あなたが言うことは真実です、停止規則はデータを考慮する前にのみ重要であるということです。これは、停止ルールがデータに関する情報を提供しますが、真の確率に関する情報は提供しないためです。したがって、データが入力されると、停止ルールは重要ではなくなります。実際の実験では、真の確率は不明であることに注意してください。したがって、確率がP + = 1の場合の状況も考慮する必要がありますおよびP=3P(+)=14、および他の可能な組み合わせ。P()=34
確率論的

したがって、と述べるあなたの例を取り上げます。これは確かに真実です!私の答えもDを条件としています。これは、実際に停止したかどうかではなく、停止ルールを教えてくれれば、実際に持っているデータセットからこれを把握できるからです。実際、データがわかれば、停止ルールが実際に停止したかどうかを判断できます。P(H|S,I)P(H|I)D
確率論的

1

さて、この上の私の知識は、2008年にHarveian演説から来http://bookshop.rcplondon.ac.uk/details.aspx?e=262 基本的に、私の記憶を最大限に結果を1としてバイアスされる)の早期停止通常、治療が期待したよりも多かれ少なかれ効果があったことを意味し、これが肯定的であれば、チャンスを生かすことができます。p値は計画されたサンプルサイズに基づいて計算されると信じています(しかし、これは間違っている可能性があります)、また、結果が常に表示されているかどうかを確認するために結果を確認している場合は、複数の比較を修正する必要がありますあなたが単なる偶然の効果を見つけていないことを保証するために。たとえば、.05未満のp値を20回チェックしてから統計的に言えば、1つの重要な結果を見つけることがほぼ確実です。


パート1まず、回答ありがとうございます。確かに、頻繁な方法は複数のテストを修正します。したがって、偏った治療効果推定の問題はそこから来ることはできません。中間分析では、テストは現在の情報に基づいており、計画された全体のサンプルサイズではなく、現在のサンプルサイズを使用します。そのため、そこからも問題は発生しません。
ocram

PART2早期に中止することは、治療が「ホップを1回行うよりも効果的」であることを意味することに同意します。その意味で、推定治療効果は予想よりも大きくなります。しかし、私によれば、これはそれを偏らせるものではありません...その代わりに、私によれば、ある意味で「私たちの希望は偏っていました」。
ocram

1

「バイアス」によってピアンタドシが一般にバイアスと呼ばれる精度の一部を意味しない限り、私はその主張に反対します。推論自体は停止することを選択したため「バイアス」されません。データが少ないため「推論」されます。いわゆる「尤度原理」では、推論は観測されたデータのみに依存し、観測された可能性のあるデータに依存するべきではないと述べています。LPは言う

P(H|D,S,I)=P(H|D,I)

HDSIDIS=g(D,I)AA=AS=g(D,I)DID,S,I=D,g(D,I),I=D,IDI それは重要です。


@probabilityislogic:ありがとう!私がそれをよく理解していれば、統計的な意味で「バイアス」をとるべきではありません。Piantadosiは推定量ではなく推定値の「バイアス」について語っているので、これは理にかなっていると思います
...-ocram

E(μμ^)2=var(μ^)+Bias(μ^)μμ^「推定器」です。2番目の項(バイアス)がサンプルサイズに依存する場合、実験を継続した場合に比べてサンプルサイズが減少しているため、早期に停止するとバイアスが増加すると予想されます。しかし、あなたが言うことから、「バイアス」はピアンタドシの観点から「エラー」として解釈されるべきであるように聞こえます。
確率論的

1
この議論は、バイアスについては何も述べておらず、問題の仮説テストの側面についてのみ述べており、誰も質問していない。
アニコ

@Prob @Anikoに同意する必要があります。nullがtrueの場合、早期終了の正の確率があることは明らかです。その場合、効果の推定値はゼロ以外になります。したがって、早期終了を条件とする推定効果の期待値は正であり、無条件の期待値はゼロです。(OPは仮説検定ではなく推定に取り組んでいることに注意してください。)
whuber

Hμ(a,a+da)SDISSSDIμ
確率論的

0

研究の終了がランダムでない場合、(「統計的な意味」で)バイアスがあります

結論に至る一連の実験では、(a)最終的に「効果なし」と判明したいくつかの実験は(偶然の結果として)何らかの効果を示し、(b)最終的に効果は「効果なし」と表示されます(おそらく電力不足の結果として)。トライアルを終了する世界では、(a)を(b)よりも頻繁に停止すると、結果を得るために偏りのある一連の研究を終了することになります。(同じロジックが効果サイズに適用されます。「予想よりも大きい」効果を示す研究を「予想どおりまたはそれより低い」よりも早期に終了する研究を終了すると、「大きな効果」の発見数が増えます。)

プラセボまたは他の被験者が治療を利用できるようにするために、早期の結果がプラスの効果を示したときに実際に医療試験が終了した場合、早期の結果が決定的でない場合はそうではなく、そのようなテストではより多くのタイプ1エラーが発生しますすべての実験を最後まで実行した場合があります。しかし、それは練習が間違っているという意味ではありません。道徳的に言えば、タイプ1エラーのコストは、完全なトライアルの終了時に実際に効果があることが示される治療の場合と同じくらい迅速に、治療を拒否するよりも低くなる可能性があります。


アニコの返事に対する私のコメントをご覧ください。私はあなたに同じ質問をするでしょう。より厳密なデモンストレーションを提供できますか?
whuber

私はアニコに任せます。彼は私よりも良い仕事をしています。しかし、「机の引き出し効果」がバイアスにつながることに同意する場合、ここでのロジックは同じです。仮説を支持するデータを支持するバイアスがあります-前者のケースb / cでは非支持データは報告されませんが、後者のb / cでは非支持データの一部は必ずしも収集されません:試験の終了結果が良さそうな早い段階では、悪い結果が遅れて発生する試行によって埋められた「悪い結果」分布の部分を除外します。このバイアスは調整できるかもしれませんが、調整が必要なバイアスがあります。
dmk38

@dmk私はあなたとあなたの両方が@Probabilityについて議論するように駆り立てているところです。
whuber

1
@ whuber、@ dmk-私たちのどちらかが間違っているからではなく、それぞれが異なる質問に答えているため、私たちは反対する運命にあると思います。頻繁に考えるPD|HS「答え」として、そしてこれがオブジェクトである場合、停止ルールは重要です。しかし、答えは何の質問ですか?私にとって、これは「仮説が正しい(またはパラメーターが値である)ことを考えると、どのデータを観察する可能性があり、早期に停止し、以前の情報から?」という質問に答えます。しかし、これは実際に私は思う(もっと後に)要求されている問題ではない
probabilityislogic

1
@probabilityそれはそれを見る一つの方法です。もう1つは、仮説を完全に回避し、実際に尋ねられている質問に対処することです。ウィットに、治療効果の大きさは何ですか?この観点から、意思決定をサポートするのに十分な精度で推定値がわかったら、終了することができます。たとえば、治療を処方することで健康が増すと、治療のコスト(および副作用)を超える可能性が高いという確信を持ちたい場合があります。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.