条件付き確率の式の背後にある直感は何ですか?


30

以下のための式の条件付き確率のことを考慮起こっが起こったである:B P AAB

P(A | B)=P(AB)P(B).

私の教科書は、ベン図の観点からこの背後にある直感を説明しています。

ここに画像の説明を入力してください

ことを考える発生したこと、のための唯一の方法イベントがの交差点に入ることで発生するためであると。A A BBAAB

その場合には、確率ではないだろう単にの確率に等しくなる交差点ため、それがイベントが発生する唯一の方法ですか?私は何が欠けていますか? A BP(A|B)AB


7
計算方法をしばらく忘れた場合、条件付き確率が「である」ことを直感的に理解していますか?
ジュホコッカラ

4
B(イベントのコンディショニングによっている起こった)、あなたは、より成果のあなたのスペースに制限だけBに(平面全体を)。確率は0〜1であるので、あなたは、点Bで測定されなければならないB.外事象Aの確率であり、すべてを忘れるΩ
Vladislavs Dovgalecs

1
イベントBが発生したことがわかると、イベントAの円の白い部分は人口の一部ではなくなるという事実を見逃しています。
モンティハーダー

4
直観は正確ではなく、単数でもないので、なぜ(単数の)正確な直観について尋ねるのですか?有用な直観で十分ですが、すべての提案がすべての人に役立つわけではありません。
ジョンコールマン

回答:


23

Aの有無にかかわらず、Bが発生したという良い直観が与えられます。Aの確率はどれくらいですか?すなわち、私たちは今、Bが発生した宇宙、つまり完全な右の円の中にいます。その円では、Aの確率は、AがBを交差する面積を円の面積で割ったものです。


5
つまり、が発生したということです。つまり、サークルに住んでいるということです。その世界の中で、レンズにあるイベントの何パーセント()?B A BBBAB
MichaelChirico

18

私はこのように考えるだろう:あなたが直観を理解するのは当然だと思う:

Bが発生したとすると、Aが発生する唯一の方法は、偶数がAとBの交差点に落ちることです。

そして、私はあなたが投稿した2番目の画像にコメントするつもりです:

  1. 白い長方形全体がサンプル空間と想像してください。Ω

    セットに確率を割り当てるとは、そのセットを何らかの意味で測定していることを意味します。これは、長方形の面積を測定した場合と同じですが、確率は特定のプロパティを持つ別の種類の測定値です(これについてはこれ以上述べません)。

  2. あり、これは次のように解釈されることを知っています。P(Ω)=1

    Ωは発生する可能性のあるすべてのイベントを表し、何かが発生する必要があるため、何かが発生する可能性は100%です。

  3. 同様に、セット確率有するである比例試料空間の確率。グラフィカルに言えば、ため、の測定(確率)はよりも小さくなければなりません。同じ推論が集合も有効です。このセットは測定でき、その測定値はです。P A Ω A Ω A P A P Ω A B P A B AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. 今が起こったと言われたら、があなたの「新しい」かのように考えなければなりません。場合あなたの「新しい」です、あなたはすべてがセットで行われていることを確認し、100%することができ。B Ω B Ω BBBΩBΩB

    そして、それはどういう意味ですか?つまり、「新しい」コンテストで、「新しい」サンプルスペースで表現する必要があることを考慮して、すべての確率尺度を再スケーリングする必要があることを意味します。。それは単純な割合です。BP(BB)=1B

    あなたが言うとき、あなたの直感はほとんど正しいです:

P(A | B)の確率は、単純にA交点Bの確率に等しくなります。

「ほぼ」は、サンプルスペースが変更され(現在はなっている)、それに応じてを再スケーリングしたいという事実によるものです。P A B BP(AB)

  1. P(AB)は、サンプル空間が現在である新しい世界でのです。言葉であなたはそれをこのように言うだろう(そしてセットで画像上にそれを視覚化してみてください):P(AB)B

    新しい世界では、の測度との測度の比率は、の測度との測度の比率と同じでなければなりません。BABΩAB

  2. 最後に、これを数学言語で翻訳します(単純な割合):

P(B):P(AB)=P(Ω):P(AB)

また、 、次のようになります。P(Ω)=1

P(AB)=P(AB):P(B)

5

次の問題について簡単に考える直感がわかります。

10個のボールがあるとします。6個の黒と4個の赤です。黒のボールのうち3個がすばらしく、赤のボールのうち1個だけがすごいです。黒のボールも恐ろしいでしょうか?

答えは非常に簡単です。合計6個のブラックボールのうち3個の素晴らしいブラックボールがあるため、50%です。

これは、確率を問題にマッピングする方法です。

  • 黒であり、対応する3つのボールP(AB)
  • 黒の6個のボールは対応P(B)
  • 黒であることがわかっているときにボールが素晴らしい確率:P(AB)

1
ではなくと書くのは意味がありませんか?n(B)=6P(B)=6
シルバーフィッシュ

@Silverfishより正確になりますが、この場合は直感を
追っていました

4

条件付き確率式の基本的な直観のために、私は常に双方向テーブルを使用するのが好きです。年間グループに150人の学生がいて、そのうち80人が女性、70人が男性で、それぞれ1つの言語コースを勉強する必要があるとします。異なるコースを受講する学生の双方向表は次のとおりです。

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

学生がイタリア語コースを受講する場合、女性である可能性はどのくらいですか?イタリア語コースには60人の学生がいますが、そのうち40人はイタリア語を勉強している女性です。

P(F|Italian)=n(FItalian)n(Italian)=4060=23

ここで、はセットカーディナリティー、つまり含まれるアイテムの数です。我々が使用するために必要なことに注意してください分子内だけでなく後者は、他の40を含むすべての80人の女性を、含まれているであろうため、イタリア語を勉強しない人。n(A)An(FItalian)n(F)

しかし、質問がひっくり返された場合、学生が女性であると仮定して、学生がイタリア語コースを受講する確率はどのくらいですか?その後、80人の女子学生のうち40人がイタリア語コースを受講します。

P(Italian|F)=n(ItalianF)n(F)=4080=12

これが理由の直観を提供することを願っています

P(A|B)=n(AB)n(B)

分数がカーディナリティではなく確率で記述できる理由を理解することは、同等の分数の問題です。たとえば、イタリア語を勉強している学生が女性である確率に戻りましょう。合計150人の学生がいるため、学生が女性でイタリア語を学習する確率は40/150(これは「共同」確率)であり、学生がイタリア語を学習する確率は60/150(これは「限界」確率です) )。結合確率を限界確率で割ると、次のようになることに注意してください。

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(分数が等しいことを確認するには、分子と分母に150を掛けると、それぞれの「/ 150」が削除されます。)

より一般的には、サンプリングスペースカーディナリティがこの例ではカーディナリティは150でした、次のことがわかります。Ωn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

論理を逆にします。と両方が次のいずれかである確率:AB

  1. 確率が発生し、が発生した場合。BA
  2. 同じですが、と逆の役割AB

これはあなたに与えます

p(AB)=p(B)p(AB)

あなたの提案に否定を探しているなら、それは確率は事実だが、それはだ与えられた、製品の確率に含まれているあなたは、元の確率空間よりも小さいでサイコロを転がしているスペース-あなたが知っています確かに、あなたはにいるので、新しいスペースのサイズで割ります。ABB


2

ベン図は確率を表すのではなく、イベント空間のサブセットの尺度を表します。確率は、2つのメジャー間の比率です。Xの確率は、「Xを構成するすべてのもの」のサイズを「検討中のすべてのイベント」のサイズで割ったものです。確率を計算するときはいつでも、「成功スペース」と「人口スペース」の両方が必要です。成功スペースの「大きさ」だけに基づいて確率を計算することはできません。たとえば、2つのサイコロで7を振る確率は、7を振る方法の数を2つのサイコロを振る方法の総数で割ったものです。7を振る方法の数を知っているだけでは、確率を計算するのに十分ではありません。P(A | B)は、「AとBの両方が発生する」という尺度の比率です。スペースと「B発生」スペースの測定。それが「|」意味:これは、「これの後に来るものを人口空間にする」ことを意味します。


2

これについて考える最良の方法は、段階的なパスを描くことだと思います。

イベントBをフェアダイスでを振るとして説明しましょう。これは、確率を持つことが簡単に示されます。次に、イベントAを、標準の52枚のカードデッキからエースを引くものとして説明します。これは、確率を持つことが簡単に示されます。416113

さあ、ダイスを振ってカードを選ぶ実験を実行しましょう。したがって、は、すでにロールしたので、エースを引く確率になります。画像を見ると、これはパス(上へ)、次にパス(上へ)になります。P(A|B)416113

直観的には、総確率空間はすでに与えられたものです:転がします。我々は無視することができと、それは我々が圧延することを説明したので、初期ダウンパスリードを。乗算の法則により、合計空間は。411312134(16×113)+(16×1213)

さて、を出したエースを引いた確率はどれくらいですか?パスを使用した答えはであり、これを合計スペースで割る必要があります。我々が得るよう4(16×113)

P(A|B)=16×113(16×113)+(16×1213).

ここに画像の説明を入力してください


2
確率木は非常に有益である可能性があるため、私はダウン投票の目的を知りました。おそらく懸念は、イラストに独立したイベントを使用すると、条件付き確率のポイントを逃すことです。つまり、確率分布は条件付けイベントに応じて変化する可能性があるということです。表面的ではないイラストを使用すると役立つ場合があります。
whuber

1

カウントの観点から考えてください。限界確率は、Aが発生した回数をサンプルサイズで割ったものです。AとBの同時確率は、AがBとともに発生した回数をサンプルサイズで割ったものです。Bが与えられたAの条件付き確率は、AがBと一緒に発生した回数をBが発生した回数で割ったもの、つまりAの「B内」のみです。

このブログでは、レゴブロックを使用してそれを示す素晴らしい視覚的なイラスト見つけることができます。


1

執筆時点では、最も重要な点を見逃していると思われる約10の回答があります。あなたは本質的に正しいです。

その場合、P(A | B)の確率は、イベントが発生する唯一の方法であるため、A交差点Bの確率と単純に等しくなりませんか?

これは間違いなく真実です。これは、を定義する量が実際に再スケーリングされる理由を説明しています。P(A|B)P(AB)

私は何が欠けていますか?

これは非常に特定のイベントであり、は1未満になる可能性があるため、Bが満たされた場合にBが満たされる確率は1であることを忘れています。は、予想どおり、Bが1に等しい場合にBの条件付き確率を作成します。実際、これはさらに良く、マップ確率にします。したがって、条件付き確率は実際には確率です。P(BB)=P(B)P(B)AP(A|B)


0

確率を推定するための具体的なデータがあれば、より直感的だと思います。

mtcars例としてデータを使用してみましょう。データは次のようになります(シリンダーの数と送信タイプのみを使用します)。

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

クロステーブルを実行することで、2つの変数の共同分布を計算できます。

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

同時確率は、2つの変数を同時に考慮することを意味します。たとえば、4気筒およびマニュアルトランスミッションの車の台数を尋ねます。

ここで、条件付き確率になります。条件付き確率を説明する最も直感的な方法は、データのフィルタリングという用語を使用することです。

を取得する場合、次の推定を行います。P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

これはつまり、4気筒の車しか気にしないということです。そこで、その上でデータをフィルタリングします。フィルタリング後、そのうちのいくつが手動送信であるかを確認します。

条件付きのthisと前述のジョイントを比較して、違いを感じることができます。


0

もしはAのスーパーセットだったB確率はA常に1その与えられて起こるB、すなわち、起こりましたP(A|B) = 1。ただし、Bそれ自体の確率は1よりもはるかに小さい場合があります。

次の例を考えてみましょう。

  • 与えられるのxは1..100の自然数、
  • Aは「x偶数」
  • Bx10で割り切れる」

それから:

  • P(A) 0.5
  • P(B) 0.1

それxが10で割り切れる(つまりxinであるB)ことを知っている場合、それも偶数(つまりxin A)であることがわかりP(A|B) = 1ます。

ベイズの規則から:

P(A|B)=P(AB)P(B)

(特殊)ケースでは、偶数と10で割り切れる数の両方の確率は、10で割り切れる数の確率と等しいことに注意してください。したがって、そしてこれをベイズの規則に戻すと、ます。P(AB)xxP(AB)=P(B)P(A|B)=P(B)/P(B)=1


非縮退の例については、たとえば、Ax7で割り切れる」およびBx3で割り切れる」であると考えてください。するとP(A|B)、「x3で割り切れることがわかっていると仮定すると、(7)で割り切れる確率は何ですか?」または、「3、6、...、99のどの部分が7で割り切れるのか」と同等ですか?


0

あなたの最初の声明は誤解かもしれません。

あなたが書いた:

Bが発生すると、Aが発生する条件付き確率の式は次のとおりです。

あなたのフレージングから、「最初のBが起こり、次にAが起こる確率を計算したい」という2つのイベントがあるかのように聞こえます。

これはそうではありません。(誤解があったかどうかにかかわらず、以下が有効です)。

イベントは1つだけであり、4つの可能性のいずれかで説明されます。

  1. どちらも。AB

  2. ちょうど、ではない。AB

  3. ではなく、ただ ;BA

  4. と両方。AB

いくつかの例を挙げて、

P(A)=0.5,P(B)=0.5,andA and B are independent.

その次の

P(A and B)=0.25andP(neither A nor B)=0.25.

最初(イベントの知識なし)、を知っていました。P(AB)=0.25

しかし、が発生したことがわかれば、別の場所にいます。は半分なので、与えられた場合の確率は、はです。が起こったことを知っているではありません。BP(AB)P(B)ABP(A|B)0.50.25B


0

条件付けの確率は、交差の確率と等しくありません。直観的な答えは次のとおりです。

1):「が起こったことを知っていますが起こる確率はどのくらいですか?」P(BA)AB

2::「またはが発生したかどうかはわかりません。両方が発生する確率はどのくらいですか?P(AB)AB

違いは、最初のものには追加情報があることです(が最初に発生することがわかっています)。2番目のものでは、何も知りません。A

2番目の確率から始めて、最初の確率を推定できます。

と両方が発生するイベントは、次の2つの方法で発生します。AB

1)の確率の確率と仮定起こりました。ABA

2)の確率の確率と仮定起こりました。BAB

両方の状況が同様に発生する可能性があります。(私は直感的な理由を見つけることができません)。したがって、両方のシナリオに重みを0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

ここで、とが独立していることを使用し、両方のシナリオが等しく発生する可能性があることを覚えておいてください。ABA

P(AB)=P(A)P(BA)

Tadaaa ...コンディショニングの確率を分離します!

ところで。誰かがシナリオ1と2が等しい理由を説明できればと思います。鍵はそこにあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.