5
シンプソンのパラドックスを解決するには?
シンプソンのパラドックスは、世界中の導入統計コースで議論されている古典的なパズルです。しかし、私のコースは、問題が存在し、解決策を提供しなかったことに単に注目することに満足しました。パラドックスを解決する方法を知りたいです。つまり、シンプソンのパラドックスに直面したとき、データの分割方法に応じて2つの異なる選択肢が最良の選択肢になるために競合するように見える場合、どちらを選択する必要がありますか? 問題を具体的にするために、関連するウィキペディアの記事に記載されている最初の例を考えてみましょう。これは、腎臓結石の治療に関する実際の研究に基づいています。 私が医者であり、検査で患者に腎臓結石があることが明らかになったとします。表に記載されている情報のみを使用して、処理Aと処理Bのどちらを採用すべきかを判断したいと思います。石のサイズがわかっている場合は、処理Aを優先する必要があります。治療Bを好むべきです。 しかし、答えに到達する別のもっともらしい方法を考えてください。石が大きい場合はAを選択し、小さい場合は再度Aを選択する必要があります。そのため、石のサイズがわからない場合でも、ケースの方法により、Aを優先する必要があることがわかります。これは、以前の推論と矛盾しています。 だから:患者が私のオフィスに入ってきます。テストでは、腎臓結石があることがわかりますが、サイズについての情報は提供されません。どの治療をお勧めしますか?この問題の受け入れられた解決策はありますか? ウィキペディアは、「因果ベイジアンネットワーク」と「バックドア」テストを使用した解決策を示唆していますが、これらが何であるかはわかりません。