はしごのラング2と3の違い


12

ユダヤ・パールの「なぜの本」で、彼は「はしごの因果関係」と呼んでいるものについて話しています。最も低いのは観測されたデータの関連性パターン(例、相関、条件付き確率など)、次は介入に焦点を当てています(データ生成プロセスを事前に指定された方法で意図的に変更するとどうなりますか?)。反事実的(何かが起こったか、起こらなかった場合、別の可能な世界で何が起こるか)?

私が理解していないのは、ラング2とラング3の違いです。反事実的な質問をする場合 、観察された世界のある側面を否定するために介入することについて単に質問するのではありませんか?


これは本当に話題ですか?好奇心を求めて
Firebug

5
@Firebugはトピックの因果関係ですか?反事実の確率(特定の薬物が誰かの死に十分であった確率など)を計算する場合、これを理解する必要があります。
カルロスチネリ

回答:


13

現実の世界と介入レベルでの関心のある行動との間に矛盾はありません。たとえば、今日まで喫煙し、明日から喫煙をやめざるを得ないということは、一方が他方を「否定する」と言っても、矛盾していません。しかし、次のシナリオを想像してください。肺癌にかかっている生涯喫煙者のジョーを知っています。そして、もしジョーが30年間喫煙していなかったら、彼は今日健康だと思いますか?この場合、私たちは同じ人に同時に対処し、行動と結果が既知の事実と直接矛盾するシナリオを想像しています。

したがって、介入と反事実の主な違いは、介入ではアクションを実行すると平均的に何が起こるかを尋ねるのに対し、反事実では特定の状況で異なる行動をとった場合に何が起こるかを尋ねていることです、実際に何が起こったかについての情報を持っていることを考えると。実際の世界で何が起こったかをすでに知っているので、観察した証拠に照らして過去に関する情報を更新する必要があることに注意してください。

これらの2種類のクエリは、異なるレベルの情報を回答する必要があるため(数学者は回答するためにより多くの情報を必要とする)、さらに明確に表現するためにより複雑な言語を必要とするため、数学的に区別されます!

Rung 3の質問に答えるために必要な情報があれば、Rung 2の質問に答えることができますが、その逆はできません。より正確には、介入情報だけでは反事実的な質問に答えることはできません。介入と反事実の衝突が発生する例は、すでにCVでここに示されています。この投稿この投稿を参照してください。ただし、完全を期すために、ここにも例を示します。

以下の例は、因果関係のセクション1.4.4にあります。

バツ=1バツ=0y=0y=1Py|バツ=0.5   バツy

PY=1|doバツ=1PY=1|doバツ=0=0

PY0=0|バツ=1Y=1

この質問は、あなたが持っている介入データだけでは答えられません。証明は簡単です。同じ介入分布を持ち、異なる反事実分布を持つ2つの異なる因果モデルを作成できます。2つを以下に示します。

ここに画像の説明を入力してください

うんPyバツ

最初のモデルでは、誰も治療の影響を受けないため、治療を受けていなかった場合に回復した治療中に死亡した患者の割合はゼロであることに注意してください。

ただし、2番目のモデルでは、すべての患者が治療の影響を受けており、平均因果効果がゼロになる2つの母集団が混在しています。この例では、反事実量が100%になりました。モデル2では、治療中に死亡したすべての患者は、治療を受けなければ回復していました。

したがって、ラング2とラング3には明確な区別があります。例が示すように、介入に関する情報と仮定だけで反事実的な質問に答えることはできません。これは、反事実を計算するための3つのステップで明らかになります。

  1. ステップ1(誘duction):ない因子の確率を更新するPあなたはPあなたは|e
  2. doバツ
  3. Y

これは、因果モデルに関する機能情報がない場合、または潜在変数に関する情報がない場合は計算できません。


面白い答え!いくつかのフォローアップ:1)「Rung 3の情報を使用すると、Rung 2の質問に答えることができますが、その逆はできません」と言います。しかし、あなたの喫煙の例では、彼が一度も喫煙したことがないなら、ジョーが健康であるかどうかを知ることは、「彼が30年の喫煙後に明日辞めたら健康になりますか」という質問に答えるのかわかりません。それらは明確な質問のように見えるので、何かが欠けていると思います。
mkt-モニカの復活

また、その後の作業例では、観察されていない2つの変数が治療とコントロールの間で非ランダムに分布していることに依存しています。しかし、あなたはこれをランダム化された実験として説明しました-これは悪いランダム化のケースではありませんか?適切なランダム化では、基本的なものを逃さない限り、このような2つの異なる結果がどのように得られるかわかりません。
mkt-モニカの復活

最後から最初まで@mkt。観測されていない変数は、処理対象と制御対象の間でランダムに分散されます。両カテゴリには、uの各カテゴリの正確に50%があります。情報とは、特定のクエリに対する答えではなく、一般的に事実に反するクエリに答えるために必要なモデルの部分的な仕様を意味します。反事実的な質問に答えるには、因果構造+いくつかの機能情報または潜在変数の分布の情報が必要です。
カルロスチネリ

0

Judea Pearl がtwitterで行った回答を次に示します。

読者からの質問:介入(ラング2)と反事実(ラング3)が異なるのはなぜですか?介入することで、観測された世界のいくつかの側面が無効になりませんか?

回答 介入は変化しますが、観察される世界と矛盾しません。なぜなら、介入の前後の世界は時間的に異なる変数を伴うからです。対照的に、「死んでいた」は既知の事実と矛盾します。最近の議論については、この議論を参照してください。

注:ハーバード大学の#causalinferenceグループとRubinの潜在的な結果フレームワークの両方は、Rung-2とRung-3を区別しません。

これは文化的に根ざした抵抗であり、将来修正されると思います。これは、#Bookofwhyの物理的な「リスニング」メタファーとは対照的に、「あたかもランダム化された」メタファーの両方のフレームワークの起源に由来します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.