「条件付け」は確率理論からの言葉です:https : //en.wikipedia.org/wiki/Conditional_probability
Cを条件とするということは、Cが真である場合のみを見ているということです。「暗黙的に」とは、この制限を明示的にせず、時にはそれを意識していないことを意味します。
ポイントは、AとBの両方がCを引き起こし、Cが真の場合にAとBの相関関係を観察しても、AとBの間に実際の関係があることを意味しないことを意味します。人為的な相関関係を作成します。
例を見てみましょう。
国には、完全に独立した2種類の病気が存在します。A:「最初の病気にかかっている人」、B:「2番目の病気にかかっている人」を呼び出します。、P (B )= 0.1と仮定します。P(A)=0.1P(B )= 0.1
今、これらの病気のいずれかを持っている人は誰でも医者に会いに行きます。Cに電話:「人は医者に行きます」。我々は持っている。C= A または B
それでは、いくつかの確率を計算しましょう。
- P(C)= 0.19
- P(A | C)= P(B | C)= 0.10.19≈ 0.53
- P(A and B|C)=0.010.19≈0.053
- P(A|C)P(B|C)≈0.28
明らかに、Cを条件にと、AとBは独立しているとはほど遠い。実際、Cを条件とすると、n o t AはBを「引き起こす」ようです。ABnotAB
医師が記録した人のリストを分析のデータソースとして使用すると、疾患とBの間に強い相関があるようです。データソースが実際に条件付けされているという事実に気付かないかもしれません。これは「選択バイアス」とも呼ばれます。AB