統計モデルは因果関係について何を言うことができますか?統計モデルから因果推論を行う場合、どのような考慮事項が必要ですか?
最初に明らかにすることは、純粋に統計的なモデルから因果推論を行うことはできないということです。因果的な仮定なしに、因果関係について何も言えない統計モデルはありません。つまり、因果推論を行うには、因果モデルが必要です。
ZXY
P(Y|do(X))=P(Y|X)XY
X
これはさらに複雑になる可能性があります。測定エラーの問題がある可能性があります。被験者は、他の問題の中でも、試験を落とすか、指示に従わない場合があります。これらの事柄が推論を伴う進行にどのように関連しているかについての仮定を行う必要があります。「純粋に」観測データでは、通常、研究者はデータ生成プロセスについて良い考えを持っていないため、これはより問題になる可能性があります。
したがって、モデルから因果推論を引き出すには、その統計的仮定だけでなく、最も重要なのはその因果仮定を判断する必要があります。因果分析に対する一般的な脅威は次のとおりです。
- 不完全/不正確なデータ
- 明確に定義されていない対象の関心対象量(特定したい因果効果は何ですか?対象母集団は何ですか?)
- 交絡(観察されない交絡因子)
- 選択バイアス(自己選択、切り捨てられたサンプル)
- 測定誤差(ノイズだけでなく交絡を引き起こす可能性があります)
- 仕様の誤り(例、機能形式の誤り)
- 外部妥当性の問題(ターゲット母集団への誤った推論)
これらの問題がないという主張(またはこれらの問題に対処したという主張)は、研究自体の設計によって裏付けられる場合があります。実験データが通常より信頼できる理由です。しかし、時には、人々はこれらの問題を理論または便利さのいずれかで取り去ります。理論が(社会科学の場合のように)ソフトである場合、額面どおりに結論を出すことは難しくなります。
バックアップできない仮定があると思うときはいつでも、それらの仮定のもっともらしい違反に対する結論の感度を評価する必要があります。これは通常、感度分析と呼ばれます。