私は、RでANCOVAを使用して二重盲検プラセボ対照RCTを分析しています。この場合、治療が行われる前に予測される「治療効果」が示されます。
研究の目的は、病気の治療が特定の行動を減らすかどうかを決定することです。病気と行動の両方を持つ人々は、50-50の治療とプラセボ対照群に無作為に割り付けられました。
予測されたように、介入とベースラインの病状との間に有意な相互作用がありました(「介入」を除くすべての変数は間隔です。これは、治療と対照群を識別する2レベルの因子変数です)。
MODEL 1:
Call:
lm(formula = follow_up_behavior ~ baseline_behavior + baseline_disease *
intervention, data = d)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.28464 0.51177 22.050 <2e-16 ***
baseline_behavior 0.77872 0.05112 15.234 <2e-16 ***
baseline_disease 0.36726 0.23110 1.589 0.1146
interventiontreatment 0.74738 0.70254 1.064 0.2895
baseline_disease:interventiontreatment -0.64681 0.31374 -2.062 0.0414 *
介入は疾患の非常に効果的な治療法であるため、相互作用は予測されましたが、ベースラインの疾患状態は、連続体に沿って0付近から非常に高い状態まで変化します。したがって、ベースラインの疾患が高い人々は治療から最大の利益を得たため、行動反応の最大の減少があったはずです。ここまでは順調ですね。
ひばりで、ベースライン動作の非常によく似たモデルを実行しました。
MODEL 2:
Call:
lm(formula = baseline_behavior ~ baseline_disease * intervention,
data = d)
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.6350 0.7620 -0.833 0.4062
baseline_disease 0.7422 0.5016 1.480 0.1415
interventiontreatment 1.1941 1.0611 1.125 0.2626
baseline_disease:interventiontreatment -1.3320 0.6510 -2.046 0.0428 *
ご覧のとおり、介入はまだ発生していませんが、病状と介入グループの間には非常に類似した有意な相互作用があります。これはランダム化の失敗のようです。
follow_up_behaviorはbaseline_behaviorと非常に高い相関があるため、最初のモデルでの重要な相互作用は2番目のモデルで見られる既存の相互作用によるものであり、したがって介入の結果ではないということが私の最大の懸念です。
私の質問は:
実際に問題がありますか?
その場合、baseline_behaviorをモデル1の制御変数として含めることで問題が解決しますか?つまり、このモデルの重要な相互作用がモデル2で見られる既存の相互作用の結果ではなく、介入によるものであることを保証しますか?
コントロールとしてbaseline_behaviorを含めることが不十分である場合、調査を回収するために何かできることはありますか?
ヘルプや洞察を事前に感謝します。