制御と治療の違いは明示的または暗黙的にモデル化する必要がありますか?


9

次の実験的なセットアップを前提とします。

複数のサンプルが対象から取得され、各サンプルは複数の方法で処理されます(コントロール処理を含む)。主に興味深いのは、コントロールと各処理の違いです。

このデータの2つの単純なモデルを考えることができます。サンプル、処理、処理0をコントロールとして、データ、をサンプルのベースライン、を処理差とします。最初のモデルは、コントロールと違いの両方を調べます。ijYijγiiδjj

Yij=γi+δj+ϵij
δ0=0

一方、2番目のモデルは違いのみを確認します。もし我々事前計算予め 次に dij

dij=YijYi0
dij=δj+εij

私の質問は、これら2つのセットアップの基本的な違いは何ですか?特に、レベル自体が無意味であり、違いのみが重要である場合、最初のモデルはあまりにも多くを行っており、おそらく能力が不足していますか?


2
私は後でより完全な答えを出すことができますが、ポール・アリソンによるこの論文が興味深いものになることをお勧めします(Allison、1990)。
アンディW

1
異なるモデルのエラーは実際には同じではないため、同じ記号を使用しないように編集されています。
ローナンデイリー

回答:


6

おそらく第2のモデルに相関することがなく、最初のものです。ϵij

最初に、これらの項は、測定誤差と加法モデルからの偏差を表しています。測定のシーケンスをランダム化するなどの適切な注意を払って、モデルが正確な場合、これらのエラーを独立させることができます。どこから

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

(これは、質問の最後の方程式と矛盾し。と仮定するのは間違っていることに注意してください。、がパラメーターではなくランダム変数であると認めることになります。少なくとも、制御の測定誤差の可能性。これは以下の同じ結論につながります。)ϵi0=0γi

以下のために、これは意味しますj,k0jk

Cov(dij,dik)=Cov(ϵijϵi0,ϵikϵi0)=Var(ϵi0)0.

相関関係はかなりの場合があります。iidエラーの場合、同様の計算により、0.5に等しいことが示されます。この相関関係を明示的かつ正しく処理する手順を使用しているのでない限り、2番目のモデルよりも最初のモデルを優先してください。


したがって、最初のモデルが真のモデルであり、2番目のモデルの望ましくないプロパティを導出したと想定しました。すべてのモデルが間違っていることがわかっているので、この結果は本当に意味がありますか?
マクロ

1
@マクロ私の回答をもっと注意深く読んでください。最初のモデルを正当化し、2番目のモデルと区別するために必要な仮定を示すために作成されていますが、モデルが「真」であるという仮定は含まれていません。たとえば、「モデルが正確な場合」の警告に注意してください。「正確な」という言葉でさえ、「真の」または「正しい」モデルがあるという誤った印象を回避することを考慮して選択されました。
whuber

1
少し混乱していますが、何ですか?dik
Andy W

1
@Andyおよび 2つの異なる処理を示します。「 ...の場合」と書いておくべきでした。そのタイプミスを修正します。それをキャッチしてくれてありがとう。jkj,k0
whuber

@whuber例えば査読者を説得するために、あなたの陳述を裏付ける参照はありますか?
ダニエル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.