ランダム割り当て:なぜわざわざ?


9

ランダム割り当ては、治療を潜在的な結果から独立させることができるため、価値があります。それが、平均治療効果の公平な推定につながる方法です。しかし、他の割り当てスキームも、治療の潜在的な結果からの独立性を体系的に保証することができます。では、なぜランダムな割り当てが必要なのでしょうか。別の言い方をすれば、不偏推論につながる非ランダム割り当て方式よりもランダム割り当ての利点は何ですか?

ましょう各要素が0(治療に割り当てられていない単位)または1(治療に割り当てられた単位)である処置の割り当てのベクトルです。JASAの記事で、Angrist、Imbens、およびRubin(1996、446-47)は、場合、処理割り当てはランダムであると述べていすべての\ mathbf {c}および\ mathbf {c'}に対して、\ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '}である場合、\ iotaはaすべての要素が1に等しい列ベクトル。ZZicPr(Z=c)=Pr(Z=c)c ι T C = ι T C ' ιcιTc=ιTcι

言い換えると、処理へのm個の割り当てを含む割り当てのベクトルが、処理へのm個の割り当てを含む他のベクトルと同じである場合、割り当てZiはランダムであるという主張です。mm

ただし、治療の割り当てからの潜在的な結果の独立性を確保するには、研究の各ユニットが治療への割り当ての確率が等しいことを確認するだけで十分です。そして、ほとんどの治療割り当てベクトルが選択される確率がゼロであっても、それは簡単に起こります。つまり、ランダムでない割り当てでも発生する可能性があります。

例を示します。ちょうど2つが扱われる4つのユニットで実験を実行したいと思います。6つの可能な割り当てベクトルがあります。

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

各数字の最初の桁は最初のユニットが処理されたかどうかを示し、2桁目は2番目のユニットが処理されたかどうかを示します。

割り当てベクトル3と4の可能性を除外する実験を実行するとします。ただし、他の各ベクトルは同じ確率(25%)で選択される可能性があります。このスキームは、AIRの意味でのランダムな割り当てではありません。しかし、予想では、それは平均治療効果の公平な推定につながります。そしてそれは偶然ではありません。被験者に治療への割り当ての確率を等しくする割り当てスキームは、ATEの公平な推定を可能にします。

それでは、なぜAIRの意味でランダムな割り当てが必要なのでしょうか。私の議論はランダム化推論に根ざしています。代わりにモデルベースの推論の観点から考えると、AIRの定義の方が防御しやすいように見えますか?


3
私はAngrist等を読んだことがないので、何かが足りないかもしれませんが、あなたの言い回しで気まぐれです。治療が潜在的な結果から独立していることを保証するために、ランダムな割り当ては使用しません。治療が真の実験の結果に依存しないかどうかは、治療と結果の直接の因果関係があるかどうかによって異なります。むしろ、ランダムな割り当ては、治療が潜んいる変数(または、潜在的な交絡因子)から独立していることを保証します。結果が、治療以外で除外したいと考えている可能性があります。
gung-モニカの復活

1
@gung、私はあなたが「潜在的な結果」と「結果」を融合していると思います。ランダムな割り当てでは、治療のアウトカムからの独立性(つまり、観察されたアウトカムからの独立性)が保証されないのは事実です。しかし、潜在的な結果は観察された結果と同じではなく、ランダムな割り当ては潜在的な結果からの治療の独立性を保証します。この点を拡張するために元の投稿を編集することはありません。そうすることで、メイントピックから離れすぎてしまいます。しかし、en.wikipedia.org / wiki / Rubin_causal_modelがこの点で役立つ場合があります。
user697473 2012

3
「治療割り当てからの潜在的な結果の独立性を保証するために、それは研究の各ユニットが治療への割り当ての等しい確率を持っていることを保証することで十分です。」これは誤りです。あなたが登録しているとし男性と研究では、女性を。公正なコインを投げます。表が出る場合は、すべての女性を治療グループに割り当てます(すべての男性をコントロールグループに割り当てます)。尾の場合は、すべての男性が治療グループに、すべての女性が対照グループになります。各被験者は(明らかに)治療グループに割り当てられる可能性が50%ありますが、治療は性別と完全に混同されます。xxx
whuber

1
@whuber、あなたのコメントは正しく聞こえません。理由を確認するために、 = 1 と仮定します。男性の潜在的な結果は、Y(1)= 1およびY(0)= 0です(つまり、男性が扱われる場合は = 1、そうでない場合は0)。女性の場合、潜在的な結果はY(1)= -1およびY(0)= 2です(特定の潜在的な結果はそれほど重要ではありませんが、小さな整数は物事を単純にします。)次にE [Y(1)| Z] = E [Y(1)] =0。E[Y(0)]についても同様の等式が成り立ちます。より一般的には、割り当てメカニズムは性別と混同されず、偏りのないATE見積もりを生成します。誤解している場合はお知らせください。Y mxYm
user697473 2012

3
確かに、停止したクロックが公平な時間の見積もりを与えるのと同じ意味で、見積もりは「偏りがない」!実際、それよりも悪いのです。このランダム選択の方法では、性別だけでなく治療にも起因しない結果が得られます。それが交絡の意味です。実験ですべての有用な情報を破棄しながら公平な結果を得ることに焦点を当てることは、赤ん坊を捨てるということわざです...
whuber

回答:


8

これはgungのコメントに続きます。全体的な平均治療効果は重要ではありません。

あなたが持っていると仮定被写体が歳の間で、新たな糖尿病症例と、およびの上に、新たな糖尿病患者。あなたは治療に半分を割り当てたいです。コインを裏返して、頭の上ですべての若い患者を治療し、尾の上ですべての高齢患者を治療しないのはなぜですか?それぞれが5 15 1000 30 50 500100051510003050%治療のために選択される可能性があるため、これは治療の平均結果にバイアスをかけませんが、多くの情報を捨てます。若年性糖尿病または若い患者が、II型糖尿病または妊娠性糖尿病のいずれかをもつ高齢の患者よりもはるかに良いまたは悪い反応を示したとしても、それは驚きではありません。観察された治療効果は公平である可能性がありますが、たとえば、ランダムな割り当てを介して発生するよりもはるかに大きな標準偏差があり、サンプルが大きいにもかかわらず多くを言うことはできません。ランダム割り当てを使用する場合、高い確率で各年齢グループの約ケースが治療を受けるので、各年齢グループ内で治療なしと治療なしを比較できます。 500

ランダム割り当てを使用するよりも上手にできる場合があります。治療への反応に影響を与えると思われる要因に気づいた場合は、その属性を持つ被験者がランダム割り当てよりも均等に分割されるようにする必要があります。ランダムな割り当てにより、すべての要素を同時に適切に処理できるため、後で多くの可能なパターンを分析できます。


ありがとう、ダグラス。この答えは私には理にかなっています。参考までに、私はあなたの例や上記の@whuberの例ほど極端なことは何も考えていませんでした。いくつかの治療ベクトルを考慮から除外する場合の代わりに考えていました。(クライアントが「この人またはその人を治療することはできるが、両方を治療することはできない」と言った場合を考えてください。)しかし、あなたの一般的なポイントは、私が考えているより穏やかな場合にも当てはまると思います。
user697473 2012

いくつかのベクトルを削除するだけで、抽出できる情報量を大幅に変更することはないと思います。これを正確に定量化するのは面倒かもしれません-おそらくあまりにも悲観的な素朴な境界があります。
ダグラスザレ2012

@DouglasZare私はあなたの極端な例について質問があります。目標は、治療が若年者と高齢者の両方の患者を持つ集団に有効であるかどうかを見つけることであると信じています。次に、メソッドは、すべての人々が治療を受ける潜在的な結果の分布とすべての人々が制御する潜在的な結果の分布から、代表的なサンプルとは見なされない2つのサンプルを生成します。したがって、観察された治療効果は偏っていますF cFtFc
KevinKim

1

あなたの例では、2と5も同様に省いて、矛盾しないようにすることができます。アイテムレベルでは、1または6を選択する確率が1:1である場合でも、1または0になる可能性は同じです。


ありがとう、ジョン。はい。それで合っています。各ユニットに処理への割り当ての確率が等しくなるように残りのベクトルを使用する限り、任意の組み合わせで、好きなだけ処理割り当てベクトルを削除できるようです。
user697473 2012

私が言っていることをあなたが理解しているとは思わない。私が提示したのは、これに反対するあなたの議論の不条理な主張です。
John

あなたの例は極端ですが、私はそれについて不合理なことは何も見ていません。これはポイントの有効なデモンストレーションです。非ランダム割り当てスキーム(ベクトル1と6のみを使用するような)は、平均処理効果の公平な推定に直接つながる可能性があります。したがって、公平なATE推定値を取得するためにランダムな割り当ては必要ありません。もちろん、ベクトル2から5を排除するのが悪い理由はまだあるかもしれません(上記のDouglas Zareのコメントを参照してください)。これらの理由についてはまだ考えていません。
user697473 2012

あなたがすべき。それがあなたがそれらを排除することができない理由です。
ジョン

1

ここに潜むまたは交絡する変数のもう1つがあります:時間(または機器のドリフト、サンプル保管の影響など)。
したがって、ランダム化には反対の意見があります(ダグラスが言うように、ランダム化よりも優れているかもしれません)。たとえば、あなたはあなたのケースが時間の経過とともにバランスを取りたいことを前もって知ることができます。事前に知っているように、性別と年齢のバランスを取りたいと思っています。

つまり、6つのスキームのいずれかを手動で選択したい場合、1100(または0011)は明らかに悪い選択だと思います。あなたが最初に投げた可能性が最もバランスのとれたものであることに注意してください...そして最悪の2つは、ジョンが2と5も(あなたが抗議しなかったので)タウトアウトすることを提案した後に残されています。
言い換えると、スキームが「素敵」であるという直感は、残念なことに実験的なデザインの不良につながります(IMHOこれは非常に一般的です。順序付けされたものがより見栄えがよく、実験中に論理シーケンスを追跡する方が確かに簡単です)。

ランダム化されていないスキームを使用すると、より良い結果が得られる可能性がありますが、はるかに悪い結果をもたらすこともできます。私見、あなたが非ランダムスキームに行くなら、あなたが使用する特定の非ランダムスキームに物理的/化学的/生物学的/医学的......引数を与えることができるはずです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.