治療前後のコントロール設計を分析する際のベストプラクティス


53

次の一般的な設計を想像してください。

  • 100人の参加者が治療グループまたは対照グループにランダムに割り当てられます
  • 従属変数は数値であり、治療の前後に測定されます

このようなデータを分析するための3つの明白なオプションは次のとおりです。

  • 混合ANOVAの時間交互作用効果によるグループのテスト
  • IVとして条件、共変量として事前測定値、DVとして事後測定値を使用してANCOVAを実行します。
  • IVとして条件、DVとして変更前後のスコアでt検定を実行します

質問:

  • そのようなデータを分析する最良の方法は何ですか?
  • あるアプローチを別のアプローチよりも好む理由はありますか?

1
「条件」と言うとき、グループ割り当てを意味しますか?
pmgjones

1
@propofol:はい。私の言語が明確でない場合はおologiesび申し上げます。
ジェロミーアングリム

1
単一の観測の時間データを統計的に評価するためのパラメトリックな「N-of-1」メソッドもあります。アプリケーション例:ncbi.nlm.nih.gov/pubmed/2039432比較方法:europepmc.org/abstract/MED/10557859/...
user31256

回答:


34

このトピックの周りには膨大な文献があり(スコアの変更/ゲイン)、最高の参考文献は生物医学分野から来ていると思います。

セン、S(2007)。医薬品開発における統計的問題。ワイリー(7章96-112章)

生物医学研究では、クロスオーバー試験の研究でも興味深い研究が行われています(特に、キャリーオーバー効果に関してですが、あなたの研究にどのように適用できるかはわかりません)。

Knapp&SchafferのGain Score tからANCOVA F(およびその逆)は、ANCOVA vs. tアプローチ(いわゆるLord's Paradox)の興味深いレビューを提供します。Sennの記事「ベースラインからの変化と共分散分析の再検討(Stat。Med。2006 25(24))」によると、変化スコアの単純な分析は、事前/事後設計の推奨方法ではありません。さらに、(2つの時点間の相関を考慮するために)混合効果モデルを使用することは、精度を高めるために共調整として「事前」測定を使用する必要があるため(たとえば、調整により)良くありません。非常に簡単に:

  • 変更スコア(ポストプレ、またはアウトカムベースライン)の使用は、不均衡の問題を解決しません。事前測定と事後測定の相関は1未満であり、事前と(事後事前)の相関は一般に負です-生のスコアで測定される治療(グループの割り当て)が比較される不公平な不利益になる場合制御するには、変更スコアに関して不公平な利点があります。
  • ANCOVAで使用される推定量の分散は、通常、生スコアまたは変化スコアの分散よりも低くなります(前後の相関が1に等しい場合を除く)。
  • 前後の関係が2つのグループ間で異なる場合(勾配)、他の方法ほど問題ではありません(変更スコアアプローチでは、2つのグループ間で関係が同一であると仮定します-平行勾配仮説)。
  • 治療の平等(結果に対する)の帰無仮説では、相互作用治療xベースラインは期待されていません。そのようなモデルを当てはめることは危険ですが、この場合、中心のベースラインを使用する必要があります(そうでなければ、治療効果は共変量の起源で推定されます)。

また、私はエドワーズの10の違いスコア神話も気に入っていますが、異なるコンテキストでの差スコアに焦点を当てています。しかし、これは変更前と変更後の分析に関する注釈付き参考文献です(残念ながら、ごく最近の研究は対象外です)。Van Breukelenはまた、無作為化および非無作為化設定でANOVAとANCOVAを比較しました。彼の結論は、少なくとも無作為化研究(平均効果への回帰を防ぐ)でANCOVAが好ましいという考えを支持しています。


明確にするために、共変量として事前テストのスコアを持つANCOVAが最良の選択肢であることを意味しますか?
mkt-モニカの復元

17

ダニエル・B・ライトは、彼の記事「あなたのデータで友達を作る」のセクション5でこれについて議論しています。彼は提案しています(p.130):

この状況で常に正しい唯一の手順は、異なるグループの時間2のスコアと時間1のスコアを比較する散布図です。ほとんどの場合、いくつかの方法でデータを分析する必要があります。アプローチが異なる結果をもたらす場合...それぞれによって暗示されるモデルについてより慎重に考えてください。

さらに読むには、次の記事をお勧めします。

  • ハンド、DJ(1994)。統計的な質問を解体します。Journal of the Royal Statistical Society:A、157、317–356。
  • ロード、FM(1967)。グループ比較の解釈におけるパラドックス。Psychological Bulletin、72、304–305。無料PDF
  • Wainer、H.(1991)。異なる基本レートの調整:主の逆説。Psychological Bulletin、109、147–151。無料PDF

9

最も一般的な戦略は次のとおりです。

  1. 1つの被験者内因子(試験前と試験後)および1つの被験者間因子(治療対対照)を使用したANOVAの反復測定。
  2. 治療後スコアのANCOVA、治療前スコアを共変量、治療を独立変数として。直感的には、両方のグループ間の差のテストが実際の目的であり、共変量が単純なt検定またはANOVAと比較してパワーを高めることができるため、事前テストのスコアを含めるという考え方です。

これらの2つのアプローチとより洗練された代替案の間の解釈、仮定、および明らかに逆説的な違い(特に参加者を治療にランダムに割り当てることができない場合)について多くの議論がありますが、それらはかなり標準のままです。

混乱の重要な原因の1つは、ANOVAの場合、関心のある効果はほとんどの場合、時間と治療の相互作用あり、治療の主効果ではないことです。ちなみに、この相互作用項のF検定は、ゲインスコアの独立サンプルt検定(つまり、各参加者のテスト後のスコアからテスト前のスコアを引いたスコア)とまったく同じ結果をもたらします。それにも行きます。

これがすべて多すぎる場合、あなたはそれを把握する時間がなく、統計学者からいくつかの助けを得ることができません、迅速で汚いが、決して完全にばかげたアプローチは、単にテスト後のスコアを事前テスト値を無視した独立サンプルt検定。これは、参加者が実際に治療グループまたは対照グループにランダムに割り当てられた場合にのみ意味があります。

最後に、それ自体はそれを選択する非常に良い理由ではありませんが、上記のアプローチ2(ANCOVA)は心理学の正しいアプローチに現在合格していると思われるので、他の何かを選択する場合は、テクニックを詳細に説明するか正当化する必要があります例えば、「ゲインスコアが悪いことが知られている」と確信している人に自分自身を。


1
最初の推奨事項である反復測定ANOVAは、事前事後データの分析には適していません。ベースライン時の介入グループでは、治療は0にコード化されていますか?いずれにせよ、これはホーソーン効果を再導入します。コントロール間の事前/事後の体系的な違いは、ランダムな変動にとらわれています。RM AN C OVAは、ポスト期間中に複数の測定がある場合に正当化され、ベースライン値は依然として共変量として調整されるか、ゲインスコアとして使用されます。
AdamO

2

ANCOVAおよび相互作用項の反復測定/混合モデルは、2つの異なる仮説をテストしています。この記事:ariticle 1およびこの記事:article 2を参照してください。


-2

2つの手段(特定のアイテム、または在庫の合計)があるため、ANOVAを検討する理由はありません。対応のあるt検定がおそらく適切です。これにより、必要なt検定を選択できます。

アイテム固有の結果、または全体的なスコアを見たいですか?アイテム分析を行いたい場合、これは有用な出発点かもしれません。


4
コントロールグループはどうですか?すべてのデータに対するペアのt検定は、悪い考えのように聞こえますが、確かに主要な質問に対処していません(治療は効果的ですか?)。治療群に限定された対応のあるt検定はもっともらしい戦略ですが、対照群を無視すると多くのデータが捨てられ、介入が実際に有効成分であるというはるかに弱い証拠になります。実際、ANOVAは、この設計を分析するための方法であり、しばしば批判される場合があります。
ガラ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.