Judea Pearl Bookの因果関係の問題


11

統計の因果推論、ジュデア・パールらによる入門書を読み始めています。al。私は数学の修士号を持っていますが、統計学のコースを受講したことはありません。私は初期の研究の質問の1つに少し戸惑っています。それについて質問できる人はいないので、このサイトの誰かが私の答えを批評してくれることを期待しています。(これは宿題の問題ではありません。私は退職者であり、私の心をアクティブに保ちます。)問題には特定のデータが与えられていないことに注意してください。

a)腎臓結石には、治療Aと治療Bの2つの治療法があります。医師は、大きな(したがってより重度の)石に治療Aを処方し、小さな石に治療Bを処方する可能性が高くなります。自分の石のサイズがわからない患者は、一般的な母集団のデータ、またはどの治療法がより効果的かを判断するときにサイズ固有のデータを調べる必要がありますか?

b)小さな町に2人の医者がいる。それぞれが彼のキャリアの中で100の手術を行いました。それは2つのタイプです:1つは非常に簡単な手術と1つは非常に難しい手術です。最初の医師は困難な手術よりもはるかに頻繁に簡単な手術を行い、2番目の医師は簡単な手術よりも頻繁に困難な手術を行います。あなたは手術が必要ですが、あなたのケースが簡単か難しいかは分かりません。すべてのケースで各医師の成功率を調べるべきですか、それとも簡単なケースと難しいケースの成功率を別々に調べるべきですか?

パートa)については、治療Bと比較して治療Aに欠点があると想定するのは理にかなっています。ですから、私の腎臓結石のサイズを知らないと、私はインテリジェントな決定を下すことができないように思えます。私は、データが治療Aが大きな石に対してより効果的であり、少なくとも小さな石に対して同様に効果的であることを示すと予想しますが、私の石が小さい場合、治療Aの推定リスクを想定したくありません。小さな石でもほぼ正常に治療できると仮定すると、治療Bの方が一般集団で成功率が高くなると予想しますが、大きな石がある場合は治療Bを採用したくありません。

石のサイズが分からない限り、データは役に立たないようです。これはおそらく質問に対する答えですか?私は薬局に行ってどちらの治療薬も店頭で購入することができないので、全体はかなり無意味に思えます。私の医者がそれを処方し、彼が石のサイズを教えてくれない(または言わない)場合、私は医者を変えます。

パートb)については、手順のレートを個別に確認する必要があることは明らかですが、レートだけでは十分ではありません。最初の医師が困難な手術を1回だけ行い、成功したとします。2番目の医師が37回、35回成功しました。私は2番目の医師と一緒に行きたいと思いますが、37点中35点を国の基準と比較したいです。彼がひどく飲み始めた後)。

この種の議論は問題によって要求されているものですか、それともよりカットアンドドライな答えが期待されていますか?インストラクターにこれを読んでもらえるのが幸運だったら、私の答えをどのように採点しますか

回答:


9

まず、あなたの質問を採点する場合、私はあなたに優れた評点を与えると言います。これらは本の導入質問であるため、問題を検討するためのすべてのツールはまだありませんが、原因の情報を考慮に入れてそれに答える必要があることがわかっていることをすでに示しています。

答えについては、質問が、集約データと分離データのどちらを見たいかを尋ねていることに注意してください。どちらの場合も、分離されたデータを確認する必要があります。

質問Aでは、石のサイズが治療法の選択と健康状態の両方に影響します。したがって、このバイアスを排除し、条件付きまたは無条件のどちらでより効果的な治療を決定するために、分離されたデータが必要です。無条件にどの治療法が優れているかを知るには、分離されたデータを使用して、石のサイズの確率によって重み付けされた平均因果効果、ここでは健康状態、治療の選択、石のサイズです。条件付きでどの処理が優れているかを知りたい場合は、分離されたテーブルも必要であることは明らかです。 PY=1|doT=ΣSPY=1|TSPSPY=1|TYTS

石のサイズを知らずに自分で治療法を選ぶことを考えるのがおかしい場合は、人口全体に対して1つの治療法だけを選ぶ必要があるという類似の質問を理解する方が簡単かもしれません(技術的/予算上の理由から、選択できない場合など)どちらも)。この場合、全体としての平均的な治療効果が最も大きいものを知りたいとします。

質問Bも同様の問題であり、難易度は交絡因子であるため、条件付きと無条件の両方で、どちらの医師が優れているかを知るために分離されたテーブルが必要です。サンプルサイズに関するポイントは完全に有効ですが、実際には常にサンプルの不確実性を考慮する必要があります---ただし、分離されたデータの情報が引き続き必要であるという事実は変わりません。

あなたの最後のコメントについて、

2つの障害が彼のキャリアの早い段階で(彼がまだ学んでいる間に)発生した場合、またはより最近(彼が強く飲み始めた後)に発生した場合。

それは実際には因果推論の深い問題に触れています。これは不変性の仮定です。ちょうど今、医者がひどく飲み始めたとしましょう。この場合、そのイベントの前後のデータは同じ因果モデルからのものではないため、実際にこのケースで推論を行うには、より多くの情報と因果関係の仮定が必要になります。


2
ありがとう。最初の問題に関するあなたの発言は特に明確でした。
saulspatz

3

私はパールの因果関係、第2版(2009)を読みましたが、ここで参照するプライマーは読みません。あなたは正確に正しい考え方でこれらの研究の質問に取り組んでいるようです。これらのシナリオに重要な因果情報を入力するために、独自の背景知識を引き出します。あなたはまた、提示された意思決定の問題について私にかなりひどく考えられている考えを直接攻撃し、それらをより意味のある現実的な問題に一生懸命取り替えています。


2
「かなりひどい考え」というフレーズの+1。もちろん、明らかな理由から、教科書の問題は完全には現実的ではありませんが、これらがどの程度現実的であると想定されていたのかははっきりしませんでした。私が読み続けるにつれて、物事はより明確になると思います。
saulspatz
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.