シンプソンのパラドックスを解決するには?


35

シンプソンのパラドックスは、世界中の導入統計コースで議論されている古典的なパズルです。しかし、私のコースは、問題が存在し、解決策を提供しなかったことに単に注目することに満足しました。パラドックスを解決する方法を知りたいです。つまり、シンプソンのパラドックスに直面したとき、データの分割方法に応じて2つの異なる選択肢が最良の選択肢になるために競合するように見える場合、どちらを選択する必要がありますか?

問題を具体的にするために、関連するウィキペディアの記事に記載さいる最初の例を考えてみましょう。これは、腎臓結石の治療に関する実際の研究に基づいています。

ここに画像の説明を入力してください

私が医者であり、検査で患者に腎臓結石があることが明らかになったとします。表に記載されている情報のみを使用して、処理Aと処理Bのどちらを採用すべきかを判断したいと思います。石のサイズがわかっている場合は、処理Aを優先する必要があります。治療Bを好むべきです。

しかし、答えに到達する別のもっともらしい方法を考えてください。石が大きい場合はAを選択し、小さい場合は再度Aを選択する必要があります。そのため、石のサイズがわからない場合でも、ケースの方法により、Aを優先する必要があることがわかります。これは、以前の推論と矛盾しています。

だから:患者が私のオフィスに入ってきます。テストでは、腎臓結石があることがわかりますが、サイズについての情報は提供されません。どの治療をお勧めしますか?この問題の受け入れられた解決策はありますか?

ウィキペディアは、「因果ベイジアンネットワーク」と「バックドア」テストを使用した解決策を示唆していますが、これらが何であるかはわかりません。


2
上記のBasic SimpsonのParadoxリンクは、観測データの例です。患者はおそらく病院にランダムに割り当てられておらず、提示された質問は、たとえば、ある病院がよりリスクの高い患者を取得する傾向があるかどうかを知る方法を与えないため、病院を明確に決定することはできません。結果をオペレーションAEに分解しても、その問題は解決されません。
エミルフリードマン

@EmilFriedman私は、病院を明確に決定できることは事実です。しかし、確かにデータは一方を他方をサポートしています。(データが病院の質について何も教えてくれなかったのは事実ではありません。)
ポテト

回答:


14

あなたの質問では、「因果ベイジアンネットワーク」と「バックドアテスト」が何であるかわからないと述べています。

因果的ベイジアンネットワークがあるとします。つまり、ノードが命題を表し、有向エッジが潜在的な因果関係を表す有向非巡回グラフです。仮説ごとにこのようなネットワークが多数ある場合があります。エッジ強度または存在について説得力のある議論を行うには3つの方法がありますか? BA?B

最も簡単な方法は介入です。これは、「適切なランダム化」が問題を解決すると言う他の回答が示唆していることです。をランダムに強制的に異なる値にし、Bを測定します。それができるなら、あなたは終わったが、あなたはいつもそれができるとは限らない。あなたの例では、致命的な病気に効果のない治療を人々に与えることは非倫理的かもしれませんし、彼らの治療でいくつかの発言があるかもしれません、例えば、彼らは腎臓結石が小さく痛みが少ないときにより厳しくない(治療B)を選ぶかもしれません。AB

2番目の方法は、フロントドア方式です。C経由でBに作用すること、つまりA C Bを示したいとします。あなたがいると仮定した場合Cは、潜在的に起因しているAが、他の原因を持っていない、とあなたがいることを測定することができますCは、と相関しているA、およびBがと相関しているC、その後、あなたは証拠が経由して流れてしなければならないと結論することができますC。元の例: Aは喫煙、Bは癌、CABCACBCACABCCABCタールの蓄積です。タールは喫煙からのみ発生する可能性があり、喫煙とがんの両方と相関しています。したがって、喫煙はタールを介してがんを引き起こします(ただし、この効果を緩和する他の原因経路がある可能性があります)。

3番目の方法は、バックドア方式です。Bが「バックドア」、たとえば一般的な原因、つまりA D Bのために相関していないことを示したいとします。因果モデルを仮定しているので、証拠がAからBに流れる可能性のあるすべてのパスを(変数を観察し、条件付けすることにより)ブロックするだけです。これらのパスをブロックするのは少し難しいですが、Pearlは、これらのパスをブロックするためにどの変数を監視する必要があるかを知ることができる明確なアルゴリズムを提供します。ABADBAB

gungは、適切なランダム化では交絡因子が問題にならないことは正しいです。仮説の原因(治療)に介入することは許可されていないと想定しているため、年齢や腎臓結石のサイズなど、仮説の原因(治療)と効果(生存)の間の一般的な原因は交絡因子になります。解決策は、適切な測定を行ってすべてのバックドアをブロックすることです。詳細については、以下を参照してください。

真珠、ユダヤ。「実証研究の因果図。」Biometrika 82.4(1995):669-688。


これをあなたの問題に適用するために、まず因果グラフを描きましょう。(治療前)腎臓結石のサイズと治療タイプYは両方とも成功Zの原因です。 他の医師が腎臓結石のサイズに基づいて治療を割り当てている場合、XYの原因である可能性があります。XYZの間に他の因果関係がないことは明らかです。 YXの後に来るため、その原因にはなりません。同様に、ZXYの後に来ます。XYZXYXYZYXZXY

以来一般的な原因であり、それが測定されるべきです。 変数の宇宙と潜在的な因果関係を決定するのは実験者の責任です。すべての実験について、実験者は必要な「バックドア変数」を測定し、変数の各構成について治療成功の限界確率分布を計算します。新しい患者の場合、変数を測定し、周辺分布によって示される治療に従います。すべてを測定できない場合、またはデータが多くないが関係のアーキテクチャについて何かを知っている場合は、ネットワーク上で「信念の伝播」(ベイジアン推論)を行うことができます。X


2
とてもいい答えです。このフレームワークを質問で示した例に適用する方法を簡単に言っていただけますか?予想される答えが得られますか(A)?
ポテト

ありがとう!「信念の伝播」の短い紹介を知っていますか?もっと学ぶことに興味があります。
ポテト

@Potato:彼の本「インテリジェントシステムにおける確率的推論」からそれを学びました。オンラインには多くのチュートリアルがありますが、アルゴリズムを提示するだけでなく、直感を構築するチュートリアルを見つけるのは困難です。
ニールG

22

私はここでシンプソンのパラドックスを議論する事前の答えを持っています:基本的なシンプソンのパラドックス。現象をよりよく理解するためにそれを読むのに役立つかもしれません。

要するに、シンプソンのパラドックスは交絡のために起こります。あなたの例では、治療は混乱しています*各患者が持っていた腎臓結石の種類。提示された結果の全表から、治療Aは常に優れていることがわかります。したがって、医師は治療Aを選択する必要があります。治療Bが全体的に良く見える唯一の理由は、治療Aがより重症の患者に投与されたのに対し、治療Aはより重症の患者に投与されたからです。それにもかかわらず、治療Aは両方の条件でよりよく機能しました。医師として、あなたは過去に、より悪い状態の患者に悪い治療が与えられたという事実を気にしません。あなたはあなたの前の患者だけを気にします、そしてあなたがその患者を改善したいなら、あなたは提供します利用可能な最高の治療とそれら。

* 実験を実行し、治療をランダム化するポイントは、治療が混同されない状況を作り出すことです。問題の研究が実験であった場合、ランダム化プロセスは公平なグループを作成できなかったと言えますが、それは観察研究であったかもしれません-私は知りません。


他の回答でも提案されている正規化アプローチを選択します。これには問題があります。正規化されたときに異なる結論を与える同じデータセットの2つのパーティションを示すことが可能です。他の回答への返信で私の​​リンクと見積もりをご覧ください。
ポテト

2
私はスタンフォードの記事を読んでいません。しかし、引用文に説得力のある理由は見つかりません。一部の集団では、治療Bは治療Aよりも優れている可能性があります。これは問題ではありません。それが一部の母集団に当てはまる場合、それは母集団の特性が混乱しているためです。あなたは(人口ではなく)患者に直面しており、その患者は治療中に改善する可能性が高くなります。その患者は腎臓結石が大きいか小さいかを考慮しません。あなたは、治療A.選択する必要があります
復活モニカ- GUNG

2
若い/古いパーティションが混乱していますか?そうでない場合、これは問題になりません。その場合、完全な情報を使用して最良の決定を下します。現在わかっていることを基にすると、「処理Bが全体で最もよく見える」はニシンです。交絡が原因であるように見えますが、それは(統計的な)幻想です。
GUNG -復活モニカ

2
腎臓結石のサイズと年齢の両方を考慮した、より複雑なテーブルが必要になります。ウィキペディアのページでバークレーの性別バイアスの事例を見ることができます。
GUNG -復活モニカ

1
コメントをこれだけ長く延長するのは嫌いですが...私はパラドックスが常に交絡によるものだとは言いません。交絡変数が持つ変数間の関係に起因しますが、シンプソンのパラドックス交絡につながるすべての変数を呼び出すわけではありません(たとえば、30歳の老人と90歳の老人xアヌムあたりのポテトチップスの量- 90年なぜなら歳はチップの主な効果を開始するために非常に軽く、相互作用のない負が含まれることができるけれども、私は交絡年齢を呼び出すことはありません。。。(最初の図を参照してくださいWikipediaのページに。。)
ジョン


4

一般的な一例またはパラドックスの解決策が必要ですか?パラドックスは複数の理由で発生する可能性があり、ケースバイケースで評価する必要があるため、後者にはありません。

パラドックスは、主に要約データを報告する際に問題となり、データの分析および報告方法を個人にトレーニングする際に重要です。データのパターンを隠したり難読化したり、データアナリストがデータの実際のパターンを認識できない要約統計を研究者が報告することは望ましくありません。解決策がないため、解決策は提供されませんでした。

この特定の場合、テーブルを持った医師は明らかにAを常に選択し、サマリー行を無視します。石の大きさを知っていてもいなくても違いはありません。データを分析している誰かがAとBに提示された要約行のみを報告した場合、医師が受け取ったデータは現実を反映しないため、問題があります。この場合、サマリー統計がどうあるべきかという1つの解釈の下でのみ正しいため、テーブルの最後の行も残しておく必要があります(2つの可能性があります)。読者に個々のセルを解釈させることは、一般的に正しい結果を生み出したでしょう。

(あなたの豊富なコメントは、不平等なNの問題について最も懸念していることを示唆しているようであり、シンプソンはそれよりも広範です。正規化の結論を提唱しているのではなく、要約統計量は比較的d意的に選択され、アナリストによる選択はパラドックスを引き起こしたと考える必要があると主張しています。持ってる。)


要約行を無視する必要があると主張します。なぜこれが「クリア」なのですか?
ポテト

処置Aは大きいまたは小さい石でより良く、Bは等しくないNのためにしか出ないので明らかです。さらに、最後の行は福音ではなく解釈です。その行を計算するには、少なくとも2つの方法があります。特定のサンプルについて何か言いたい場合にのみ、そのように計算します。
ジョン

申し訳ありませんが、概要行が間違ったレポートである理由がわかりません。私はあなたの中心点を見逃していると思います。説明してもらえますか?
ポテト

1
正規化してから平均化すると、「正しい」結果が得られます(A)。しかし、これは違法です。以下の引用は、スタンフォード哲学百科事典の関連記事から引用したもので、こちらから入手できます。plato.stanford.edu
Potato

2
「シンプソンの逆転は、総人口の関連性と一致する人口を分割する多くの方法があることを示しています。性別による分割は、新しい治療を提供すると男性と女性の両方が悪化したことを示し、同じ集団のパーティション年齢別にみると、50歳未満の患者と50歳以上の患者は両方とも新しい治療法のほうが良好でした。同じ母集団を分割するさまざまな方法からのデータを正規化すると、総母集団に含まれる関連性に関する矛盾した結論が得られます
ポテト

4

重要な「テイクアウェイ」の1つは、サブグループ間で治療の割り当てが不均衡な場合、データの分析時にサブグループを考慮する必要があることです。

2番目に重要な「テイクアウェイ」は、シンプソンのパラドックスの存在が不明であるため、観察研究が特に間違った答えを出す傾向があることです。それは、治療Aがより困難なケースに与えられる傾向があるという事実を、それがわからない場合には修正できないためです。

適切にランダム化された研究では、(1)1つの治療に「不当な優位性」を与える可能性が非常に低く、データ分析で自動的に処理されるように治療をランダムに割り当てるか、(2)重要な理由がある場合そのためには、既知の問題に基づいてランダムに、しかし不均衡に処理を割り当て、分析中にその問題を考慮します。


+1、しかし、「自動的に面倒を見る」というのはあまり真実ではありません(少なくとも当面の状況では、これは主に気にすることです)。長い目で見ればそれは事実ですが、サンプリングエラーが原因で、I型とII型のエラーが非常に多く発生する可能性があります(つまり、1つの治療条件の患者は偶然だけでより深刻な病気になりやすい)。
GUNG -復活モニカ

しかし、コンティンジェンシーテーブルを分析し、p値を計算して適切に解釈するときに、サンプリングエラーの影響が考慮されます。
エミルフリードマン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.