変数の制御が不適切な場合


15

少なくとも1つの素朴な例を考えることができます。XとZの関係を調べたいとします。また、YがZに影響を与えるのではないかと疑って、Yを制御します。しかし、結局のところ、X Yの場合、XはYを与えられたZから独立しているため、XとZの関係を「カバー」します。

さて、前の例では、勉強しなければならない関係がXとY、およびYとZの関係である場合があります。ただし、そのようなことを先験的に知っていれば、最初の場所。私がDIDで行った研究は、XとZの間に関係がないことを示唆していますが、これは事実ではありません... XとZは関連しています。

これは、次の依存関係図に示されています。適切なシナリオでは、ZはXとYに依存し、XとYは独立しています。Yを正しく制御してXとZの関係を決定します。左のシナリオでは、ZはXに依存するYに依存します。XとZはYが与えられると独立します。 Y.

variable_relationships

私の質問は基本的に「変数Yを制御するのが適切な場合とそうでない場合」です。XとYの関係を完全に調査することは困難または不可能な場合がありますオプション。調査を実施する前に、どのように決定すればよいのでしょうか?

引用に感謝します。


7
例として、人種差別の影響を評価する際の正確な状況が浮かび上がります。ましょレースになります。してみましょうZは賃金こと。してみましょうYは教育すること。教育が賃金に影響を与えることは明らかです。そのため、あなたはそれを管理したいと思いますが、人種差別により少数民族がより悪い教育を受けるようになった場合、教育の管理はその差別を隠蔽します。例えば。Neal and Johnson(1996)を参照してください。アレクシスの答えが指摘しているように、あなたはあなたの問題の詳細に入る必要があります。すべてを解決する簡単なボタンはありません。XZY
マシューガン

1
シンプルなボタンを押すことを望んでいませんでした。確かに、私の質問に些細な答えがあることが判明した場合、私は非常に失望したでしょう。:)
スコット

1
@Repmatはい。ただし、IV推定の4つの仮定はめったに満たされず、たとえそうであっても、関連する関連性の強さによってIV推定にバイアスのある結果を与えることができます。たとえば、Hernánand Robinsの因果推定(私の回答の完全な引用とリンク)、第16章:インストルメンタル変数の推定を参照してください。
アレクシス

1
@アレクシス当然、IVを手に入れるのは困難です...「無料のランチはありません」とすべてですが、あなたがそうするとき、あなたはほとんどまたはまったく疑いなくしばしばそう知っています。
レプマット

1
@Repmat ...有効なIV推定値の前提条件は、描かれているDAGよりも多く必要です...それらは本当に非常に脆弱です。
アレクシス

回答:


7

3番目の変数に何らかの予測変数が与えられた場合の結果の確率の調整(調整)は広く行われていますが、正しく指摘するように、結果の推定値に因果効果の表現としてバイアスを実際に導入する可能性があります。これは、潜在的な因果的交絡因子の「古典的な」定義でも発生する可能性があります。なぜなら、交絡因子自体と関心のある予測子の両方が、さらに上流に因果的交絡因子を持っているからです。たとえば、以下のDAGでは、LEのDに対する因果効果の古典的な交絡因子です。これは、(1)Eを引き起こし、したがってEに関連付けられているため、(2)Dに関連付けられているためDに関連付けられているためですLEDEDDに関連付けられている U 2。ただし、 L(「コライダー」)の P D | E を条件付けまたは階層化すると、 Eの影響の偏った因果推定値が生成されます。U2DP(D|E)LEので、 Lはと混同されている D未測定変数で U 2、及び Lは、と混同されています E未測定変数 U 1によるDLDU2LEU1

DAG

偏りのない因果推定を提供するために分析または条件付けする変数を理解するには、因果効果の識別可能性の基準を使用して考えられるDAGを慎重に検討する必要があります。 。ショートカットはありません。一般的な交絡パターンを学びます。一般的な選択バイアスパターンを学習します。練習。

参照資料

グリーンランド、S。、パール、J。、およびロビンズ、JM(1999)。疫学研究の因果図疫学、10(1):37-48。

マサチューセッツ州エルナン、JMロビンス(2018)。因果推論。チャップマン&ホール/ CRC、フロリダ州ボカラトン

Maldonado、G.およびGreenland、S.(2002)。因果効果の推定International Journal of Epidemiology、31(2):422–438。

パール、J。(2000)。因果関係:モデル、推論、と推論。ケンブリッジ大学出版局。


12

私はあなたの質問に対する一文の素早い答えを信じています。

変数Yを制御するのが適切な場合とそうでない場合

「バックドア基準」です。

Judea Pearlの構造的因果モデルは、ある変数が別の変数に与える因果的影響を推測するために、条件付けに十分な変数(および必要な場合)を明確に伝えることができます。つまり、これは、パールによるこのレビューペーパーの19ページで説明されているバックドア基準を使用して回答されます。

主な注意点は、変数間の因果関係を知る必要があることです(グラフの方向矢印の形で)。それを回避する方法はありません。これは、困難と可能性のある主観性が作用する場所です。Pearlの構造的因果モデルでは、因果モデル(有向グラフ)が与えられた正しい質問に答える方法、データ分布が与えられた因果モデルのセット、または正しい実験を行って因果構造を探す方法のみを知ることができます。データ分布のみが与えられた場合、正しい因果構造を見つける方法はわかりません。実際、変数の意味に関する外部の知識/直感を使用しないと、これは不可能であると主張しています。

バックドアの基準は次のように述べることができます。

Xの因果的影響を見つけるにはX変数の集合は、ノードSは、次の両方の基準のことを満たす限り、上に条件付けすることが十分です。Y,S

1)要素はXの子孫ではないSX

2)SXYの間のすべての「バックドア」パスをブロックしますXY

ここで、「バックドア」パスとは、単に次で始まる矢印のパスです Xを指す矢印で終わる(他のすべての矢印が指す方向は重要ではありません。)そして、「ブロック」は、それ自体、特定の意味を持つ基準であり、上記のリンクの11ページに記載されています。これは、「D-分離」について学習するときに読む基準と同じです。私は個人的に、ビショップのパターン認識と機械学習の第8章では、上でリンクした真珠のソースよりもはるかに優れたD分離のブロックの概念について説明していることを発見しました。しかし、次のようになります。YX.

ノードの集合、S,ブロック間の経路Yを、それを満たす以下の基準の少なくとも1つが:XY

あるパス内のノードの1)一方、発光する経路上の少なくとも一つの矢印(すなわち、矢印はノードから離れて向いています)S,

2)どちらにもないノード ないノード、または Sのノードの祖先で「衝突」するパスに2つの矢印があります(つまり、直接対面します)SS

これはあるか、ある一般的なバックドア基準とは異なり、基準及び基準。

バックドアの基準を明確にするために、特定の因果モデルについて十分な変数を条件付けすると、データの確率分布から因果影響を学習できることがわかります。(私たちが知っているように、複数の因果構造が同じ分布の原因となる可能性があるため、共同分布だけでは原因行動を見つけるのに十分ではありません。これが原因モデルも必要な理由です。)観測データの機械学習方法。あなたが知っている限り 因果構造により変数(または変数のセット)の条件付けが可能になるため、ある変数の別の変数への因果影響の推定値は、統計的手法で取得したデータの分布の推定値と同じくらい良好です。

以下は、2つの図にバックドア基準を適用したときに見つけるものです。

どちらの場合も、からXへのバックドアパスは存在しませんしたがって、Yが「すべての」バックドアパスをブロックするのは事実です。しかし、左図では、Yは、の直接の子孫であり、X 右図ではないが。したがって、Yは右図のバックドア基準に従いますが、左図には従いません。これらは当然の結果です。ZX.YYX,Y

されて、それは完全な画像である限り、あなたは上の条件ではない必要があるとして、驚くべき、しかし、ことは、右図にあるの完全な因果影響を取得するためにXZを。(当該他の方法、ヌルの値のでセットを満たすバックドア基準、及び、こうしてコンディショニングのために十分である。)を直感的に、これは真実であるXをと関連付けられていないYあなたは上単に平均することができ、十分なデータのためにそうYの値は、Zに対するYの効果を周辺化しますこの点に対する反対意見の1つは、データが制限されているため、以下の代表的な分布がないことです。YXZXYYYZ. Yは、制御に必要になります。Y値。ただし、バックドアの基準では、データの確率分布があることを前提としていることを思い出してください。その場合、を分析的にマージナライズできます有限データセットの辺縁化は単なる推定です。また、これが完全な図である可能性は非常に低いことに注意してください。Xに影響を与える可能性のある外部要因がありますこれらの要因が何らかの形でYにも関連付けられている場合、Yを条件付けする必要があるかどうか、またはそれで十分かどうかを確認するために、さらに作業を行う必要があります。YからXを指す別の矢印を描くと、Y.X.YYYXY

もちろん、これらは非常に単純な例であり、を制御できる場合と制御できない場合を知るには直観で十分です。しかし、図を見ても明らかでないいくつかの例がありますが、バックドアの基準を使用できます。次の図では、Zに対するXの因果的影響を判断するときにYを制御するのに十分かどうかを尋ねますYYXZ.

Is it sufficient to control for $Y$ to find the causal impact of $X$ on $Z$?

最初に注意することは、どちらの場合でも、Xの子孫ではないということです。したがって、その基準を満たします。次に注意すべきことは、どちらの場合も、ZからXへのバックドアパスがいくつかあるということです。左の図に2つ、右に3つ。YX.ZX.

ZYXZWBAX. YY B,B,YZYX

ZWBYX. Y ZYXZWBAX,B.

YAWXZB.XZB,BAWBAWXZ

前に述べたように、バックドア基準を使用するには、因果モデル(つまり、変数間の矢印の「正しい」図)を知っている必要があります。しかし、構造的因果モデルは、私の意見では、そのようなモデルを検索したり、検索が役に立たない時期を知るための最良かつ最も正式な方法も提供します。また、「混乱」、「調停」、「スプリアス」(すべて私を混乱させる)などの用語を時代遅れにするというすばらしい副作用もあります。写真を見せてください。どのサークルを制御する必要があるかを説明します。


3
いいね 私は、真珠の因果関係を私の回答の参照セクションに追加するかどうかを議論していました。:)
アレクシス

0

以下は、あなたのケースに適切かもしれませんし、そうでないかもしれません:X治療であれば、マッチングを行うときに変数を保持する傾向スコアマッチングを使用することで問題を回避できるかもしれませんY。つまり、Y治療を受けることを予測する共変量(そのような共変量の1つ)のバランスをとりますX。上記の
結果変数への参照がないことに注意してくださいZ。また、あなたの観測があなたにどのくらいの洞察を与える可能性がある、(前とバランスのテーブルに一致した後に生成することによって)されているバランスがどのように確認することができますXによって決定されますがY

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.