中間解析は、おそらく初期の研究を終了する前に1つの以上の時点でのデータの分析を意図して研究の公式近い、例えば、あります。
Piantadosi、S.(臨床試験-方法論的観点)によると:「治験が早期に終了した場合、治療効果の推定値は偏ります。決定が早ければ早いほど、偏りが大きくなります。」
この主張を説明してもらえますか。精度が影響を受けることは簡単に理解できますが、バイアスに関する主張は私には明らかではありません...
中間解析は、おそらく初期の研究を終了する前に1つの以上の時点でのデータの分析を意図して研究の公式近い、例えば、あります。
Piantadosi、S.(臨床試験-方法論的観点)によると:「治験が早期に終了した場合、治療効果の推定値は偏ります。決定が早ければ早いほど、偏りが大きくなります。」
この主張を説明してもらえますか。精度が影響を受けることは簡単に理解できますが、バイアスに関する主張は私には明らかではありません...
回答:
まず、コンテキストに注意する必要があります。これは、何らかのランダムな外部の理由ではなく、有効性/無益性を示す中間モニタリングのために試験が早期に停止した場合にのみ適用されます。その場合、効果サイズの推定値は完全に統計的な意味で偏ります。有効性のために停止した場合、推定効果は高すぎます(正の場合)、無益のために停止した場合、低すぎます。
Piantodosiは直感的な説明も提供します(私のエディションの10.5.4項)。2つの平均の真の差が1ユニットであるとします。多くの試行を実行し、中間分析時にそれらを見ると、それらのいくつかは、1をはるかに超える、1をはるかに下回る、1を中心とする効果サイズを観測します-分布は広くなりますが、対称的です。この時点で推定される効果の大きさはそれほど正確ではありませんが、公平です。ただし、差が大きい場合(複数のテスト用に調整)、つまり推定値が高い場合にのみ、エフェクトサイズを停止して報告します。それ以外の場合はすべて続行し、見積もりを報告しません。それは、早期に停止したことを条件とすることを意味します、効果サイズの分布は対称ではなく、その期待値は推定の真の値を超えています。
この効果が早い段階でより深刻であるという事実は、試行を停止するためのより大きなハードル、したがって、調整の間に分布の大部分が捨てられることに起因しています。
結論にバイアスが生じる可能性のある理由と、それが完全なストーリーではない理由を以下に示します。プラス(+1)の効果が期待されるが、マイナスの効果(-1)が期待される薬物の連続試験があるとします。5匹のモルモットを次々にテストします。単一のケースにおける肯定的な結果の未知の確率は、実際にはおよび否定的な結果1。
したがって、5回の試行の後、異なる結果の確率は
Outcome Probability
+5-0 = +5 243/1024
+4-1 = +3 405/1024
+3-2 = +1 270/1024
+2-3 = -1 90/1024
+1-4 = -3 15/1024
+0-5 = -5 1/1024
したがって、全体として肯定的な結果の確率は918/1024 = 0.896であり、平均の結果は+2.5です。5回の試行で割ると、これは1回の試行あたり平均+0.5の結果です。
それもあるように、それは、公平な図である。
モルモットを保護するために、いずれかの段階で累積結果が陰性である場合、研究は終了するとします。その後、確率は
Outcome Probability
+5-0 = +5 243/1024
+4-1 = +3 324/1024
+3-2 = +1 135/1024
+2-3 = -1 18/1024
+1-2 = -1 48/1024
+0-1 = -1 256/1024
したがって、全体として肯定的な結果の確率は702/1024 = 0.6855であり、平均の結果は+1.953です。前の計算で試行ごとの結果の平均値を調べた場合、つまり+ 5を使用した場合、+3、+1、−1、−1および−1場合、+ 0.184になります。
これらは、2番目のスキームで早期に停止することによってバイアスがあり、バイアスが予測される方向にあるという感覚です。しかし、それは完全な話ではありません。
なぜwhuberとprobabilityislogicは、早期に停止することで公平な結果が得られると考えるのか 2番目のスキームでの試験の予想結果は+1.953です。予想される試行回数は3.906回です。したがって、一方をもう一方で割ると、以前とまったく同じように+0.5が得られ、偏りがないと説明されました。
さて、この上の私の知識は、2008年にHarveian演説から来http://bookshop.rcplondon.ac.uk/details.aspx?e=262 基本的に、私の記憶を最大限に結果を1としてバイアスされる)の早期停止通常、治療が期待したよりも多かれ少なかれ効果があったことを意味し、これが肯定的であれば、チャンスを生かすことができます。p値は計画されたサンプルサイズに基づいて計算されると信じています(しかし、これは間違っている可能性があります)、また、結果が常に表示されているかどうかを確認するために結果を確認している場合は、複数の比較を修正する必要がありますあなたが単なる偶然の効果を見つけていないことを保証するために。たとえば、.05未満のp値を20回チェックしてから統計的に言えば、1つの重要な結果を見つけることがほぼ確実です。
「バイアス」によってピアンタドシが一般にバイアスと呼ばれる精度の一部を意味しない限り、私はその主張に反対します。推論自体は停止することを選択したため「バイアス」されません。データが少ないため「推論」されます。いわゆる「尤度原理」では、推論は観測されたデータのみに依存し、観測された可能性のあるデータに依存するべきではないと述べています。LPは言う
それは重要です。
研究の終了がランダムでない場合、(「統計的な意味」で)バイアスがあります。
結論に至る一連の実験では、(a)最終的に「効果なし」と判明したいくつかの実験は(偶然の結果として)何らかの効果を示し、(b)最終的に効果は「効果なし」と表示されます(おそらく電力不足の結果として)。トライアルを終了する世界では、(a)を(b)よりも頻繁に停止すると、結果を得るために偏りのある一連の研究を終了することになります。(同じロジックが効果サイズに適用されます。「予想よりも大きい」効果を示す研究を「予想どおりまたはそれより低い」よりも早期に終了する研究を終了すると、「大きな効果」の発見数が増えます。)
プラセボまたは他の被験者が治療を利用できるようにするために、早期の結果がプラスの効果を示したときに実際に医療試験が終了した場合、早期の結果が決定的でない場合はそうではなく、そのようなテストではより多くのタイプ1エラーが発生しますすべての実験を最後まで実行した場合があります。しかし、それは練習が間違っているという意味ではありません。道徳的に言えば、タイプ1エラーのコストは、完全なトライアルの終了時に実際に効果があることが示される治療の場合と同じくらい迅速に、治療を拒否するよりも低くなる可能性があります。