基礎科学における逐次仮説検定


16

私は薬理学者であり、私の経験では、基本的な生物医学研究のほとんどすべての論文で、スチューデントのt検定を使用しています(推論をサポートするため、または期待に準拠するために...)。数年前、スチューデントのt検定は使用できる最も効率的なテストではないことに気付きました:順次テストでは、あらゆるサンプルサイズでより大きな検出力、または同等の検出力で平均してはるかに小さなサンプルサイズが得られます。

さまざまな複雑さの連続手順が臨床研究で使用されていますが、基本的な生物医学研究の出版物で使用されている手順を見たことはありません。私は、彼らが最も基本的な科学者が見そうなすべての入門レベルの統計教科書にも欠席していることに注意します。

私の質問は3つあります。

  1. 順次テストの非常に大きな効率の利点を考えると、なぜより広く使用されないのですか?
  2. 非統計学者によるそれらの使用が推奨されないことを意味する逐次的方法の使用に関連する欠点はありますか?
  3. 統計の学生は、シーケンシャルなテスト手順について教えられていますか?

3
念のため、臨床試験で見つかったSTについて話していますか(例:en.wikipedia.org/wiki/Sequential_analysis)
chl

はい。シーケンシャルt検定など、シーケンシャルテストには多くのバリエーションがありますが、基礎研究では使用されていません。私はそれらの使用に対する障害を見ていません。
マイケルルー-モニカを

(+1)一連のテストを偶然見つけて、同じ質問を自問自答しました。
ステフェン

回答:


5

暫定分析(Jennison and Turnbull、2000)およびコンピューター化された適応テスト(van der Linden and Glas、2010)以外のシーケンシャルテストとその応用についてはあまり知りません。1つの例外は、高額な費用と被験者登録の難しさに関連する一部のfMRI研究です。基本的に、この場合、シーケンシャルテストの主な目的は、実験を早期に停止することです。したがって、これらの非常に調整されたアプローチが通常の統計学のクラスで教えられていないことは驚きではありません。

ただし、連続テストには落とし穴がないわけではありません(タイプIおよびIIのエラーを事前に指定する必要があり、停止ルールの選択と結果のマルチルックを正当化する必要があります。p値は、固定値のようにnullの下で均一に分布していませんサンプルデザインなど)。ほとんどの設計では、何らかの費用対効果の基準を最適化するために、事前に指定された実験設定で作業するか、予備の電力研究を実施しました。この場合、標準の試験手順が適用されます。

私は、しかし、固定についてはMaik Dierkesから次の用紙た:非常に興味深いオープンサンプルデザイン実験のシーケンシャルな設計のための請求を


基本的な生物医学研究者は常に中間分析を行いますが、それが重要であることさえ知らないので、彼らはそれらを宣言しません!私は全国大会で研究者を調査しましたが、スチューデントのt検定からのエラー率の制御が事前に決められた固定サンプルサイズに依存していることを50%以上が知りませんでした。時々不規則に使用されるサンプルサイズでその証拠を見ることができます。
マイケルルー-モニカを

シーケンシャル設計の複雑さから生じるいくつかの欠点は、その実装ではなく、分析の設計に特にあります。おそらく、小さなサンプルの基本的な実験のために、あらかじめ用意された一連のデザインを用意することができます。
マイケルルー-モニカを

@Michael「フェイク」中間解析について(研究がまだ発展段階にある間にp値を見る):統計の不適切な使用であるように見えます。
chl

@Chi 1つのレベルでは、はい、宣言されておらず修正されていない中間分析は不適切です(ただし、無知で行われています。ただし、メタレベルで検討すると、部分的な正当化を見つけることができます。多くの実験には、小さなサンプルが含まれているため、誤検出率の増加は、より多くの電力の妥当なトレードオフになる可能性があります。条約は、0.05を超えるアルファの宣言レベルを除外しています。
マイケルルー-モニカを

この文脈で、基本的な生物医学研究者は、「P <0.05が有意であると考えられる結果」というステートメントが別の方法で示唆している場合でも、ネイマンピアソンのアプローチだけで作業するわけではないことに注意してください。フィッシャーの有意性テストの範囲内に留まり、達成されたP値以外の考慮事項をテスト結果の処理方法の決定に組み込むことができる場合、中間分析はそれほど悪くないかもしれません。ただし、設計されたシーケンシャルテストが設計されていないテストよりも優れていることは確かです。
マイケルルー-モニカを
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.