私はあなたの質問に対する一文の素早い答えを信じています。
変数Yを制御するのが適切な場合とそうでない場合
「バックドア基準」です。
Judea Pearlの構造的因果モデルは、ある変数が別の変数に与える因果的影響を推測するために、条件付けに十分な変数(および必要な場合)を明確に伝えることができます。つまり、これは、パールによるこのレビューペーパーの19ページで説明されているバックドア基準を使用して回答されます。
主な注意点は、変数間の因果関係を知る必要があることです(グラフの方向矢印の形で)。それを回避する方法はありません。これは、困難と可能性のある主観性が作用する場所です。Pearlの構造的因果モデルでは、因果モデル(有向グラフ)が与えられた正しい質問に答える方法、データ分布が与えられた因果モデルのセット、または正しい実験を行って因果構造を探す方法のみを知ることができます。データ分布のみが与えられた場合、正しい因果構造を見つける方法はわかりません。実際、変数の意味に関する外部の知識/直感を使用しないと、これは不可能であると主張しています。
バックドアの基準は次のように述べることができます。
Xの因果的影響を見つけるにはXに変数の集合は、ノードSは、次の両方の基準のことを満たす限り、上に条件付けすることが十分です。Y,S
1)要素はXの子孫ではないSX
2)SはXとYの間のすべての「バックドア」パスをブロックしますXY
ここで、「バックドア」パスとは、単に次で始まる矢印のパスです Xを指す矢印で終わる。(他のすべての矢印が指す方向は重要ではありません。)そして、「ブロック」は、それ自体、特定の意味を持つ基準であり、上記のリンクの11ページに記載されています。これは、「D-分離」について学習するときに読む基準と同じです。私は個人的に、ビショップのパターン認識と機械学習の第8章では、上でリンクした真珠のソースよりもはるかに優れたD分離のブロックの概念について説明していることを発見しました。しかし、次のようになります。YX.
ノードの集合、S,ブロック間の経路とYを、それを満たす以下の基準の少なくとも1つが:XY
あるパス内のノードの1)一方、発光する経路上の少なくとも一つの矢印(すなわち、矢印はノードから離れて向いています)S,
2)どちらにもないノード ないノード、または Sのノードの祖先で「衝突」するパスに2つの矢印があります(つまり、直接対面します)SS
これはあるか、ある一般的なバックドア基準とは異なり、基準及び基準。
バックドアの基準を明確にするために、特定の因果モデルについて十分な変数を条件付けすると、データの確率分布から因果影響を学習できることがわかります。(私たちが知っているように、複数の因果構造が同じ分布の原因となる可能性があるため、共同分布だけでは原因行動を見つけるのに十分ではありません。これが原因モデルも必要な理由です。)観測データの機械学習方法。あなたが知っている限り 因果構造により変数(または変数のセット)の条件付けが可能になるため、ある変数の別の変数への因果影響の推定値は、統計的手法で取得したデータの分布の推定値と同じくらい良好です。
以下は、2つの図にバックドア基準を適用したときに見つけるものです。
どちらの場合も、からXへのバックドアパスは存在しません。したがって、Yが「すべての」バックドアパスをブロックするのは事実です。しかし、左図では、Yは、の直接の子孫であり、X 、右図ではないが。したがって、Yは右図のバックドア基準に従いますが、左図には従いません。これらは当然の結果です。ZX.YYX,Y
何されて、それは完全な画像である限り、あなたは上の条件ではない必要があるとして、驚くべき、しかし、ことは、右図にあるの完全な因果影響を取得するためにXにZを。(当該他の方法、ヌルの値のでセットを満たすバックドア基準、及び、こうしてコンディショニングのために十分である。)を直感的に、これは真実であるXをと関連付けられていないYあなたは上単に平均することができ、十分なデータのためにそうYの値は、Zに対するYの効果を周辺化します。この点に対する反対意見の1つは、データが制限されているため、以下の代表的な分布がないことです。YXZXYYYZ. Yは、制御に必要になります。Y値。ただし、バックドアの基準では、データの確率分布があることを前提としていることを思い出してください。その場合、を分析的にマージナライズできます。有限データセットの辺縁化は単なる推定です。また、これが完全な図である可能性は非常に低いことに注意してください。Xに影響を与える可能性のある外部要因があります。これらの要因が何らかの形でYにも関連付けられている場合、Yを条件付けする必要があるかどうか、またはそれで十分かどうかを確認するために、さらに作業を行う必要があります。YからXを指す別の矢印を描くと、Y.X.YYYXY
もちろん、これらは非常に単純な例であり、を制御できる場合と制御できない場合を知るには直観で十分です。しかし、図を見ても明らかでないいくつかの例がありますが、バックドアの基準を使用できます。次の図では、Zに対するXの因果的影響を判断するときにYを制御するのに十分かどうかを尋ねます。YYXZ.
最初に注意することは、どちらの場合でも、はXの子孫ではないということです。したがって、その基準を満たします。次に注意すべきことは、どちらの場合も、ZからXへのバックドアパスがいくつかあるということです。左の図に2つ、右に3つ。YX.ZX.
Z←Y→XZ←W→B←A→X. YY B,B,YZ←Y→X
Z←W→B→Y→X. Y Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAWBAWXZ
前に述べたように、バックドア基準を使用するには、因果モデル(つまり、変数間の矢印の「正しい」図)を知っている必要があります。しかし、構造的因果モデルは、私の意見では、そのようなモデルを検索したり、検索が役に立たない時期を知るための最良かつ最も正式な方法も提供します。また、「混乱」、「調停」、「スプリアス」(すべて私を混乱させる)などの用語を時代遅れにするというすばらしい副作用もあります。写真を見せてください。どのサークルを制御する必要があるかを説明します。