以下のための式の条件付き確率のことを考慮起こっが起こったである:B P (A
私の教科書は、ベン図の観点からこの背後にある直感を説明しています。
ことを考える発生したこと、のための唯一の方法イベントがの交差点に入ることで発生するためであると。A A B
その場合には、確率ではないだろう単にの確率に等しくなる交差点ため、それがイベントが発生する唯一の方法ですか?私は何が欠けていますか? A B
以下のための式の条件付き確率のことを考慮起こっが起こったである:B P (A
私の教科書は、ベン図の観点からこの背後にある直感を説明しています。
ことを考える発生したこと、のための唯一の方法イベントがの交差点に入ることで発生するためであると。A A B
その場合には、確率ではないだろう単にの確率に等しくなる交差点ため、それがイベントが発生する唯一の方法ですか?私は何が欠けていますか? A B
回答:
Aの有無にかかわらず、Bが発生したという良い直観が与えられます。Aの確率はどれくらいですか?すなわち、私たちは今、Bが発生した宇宙、つまり完全な右の円の中にいます。その円では、Aの確率は、AがBを交差する面積を円の面積で割ったものです。
私はこのように考えるだろう:あなたが直観を理解するのは当然だと思う:
Bが発生したとすると、Aが発生する唯一の方法は、偶数がAとBの交差点に落ちることです。
そして、私はあなたが投稿した2番目の画像にコメントするつもりです:
白い長方形全体がサンプル空間と想像してください。
セットに確率を割り当てるとは、そのセットを何らかの意味で測定していることを意味します。これは、長方形の面積を測定した場合と同じですが、確率は特定のプロパティを持つ別の種類の測定値です(これについてはこれ以上述べません)。
あり、これは次のように解釈されることを知っています。
は発生する可能性のあるすべてのイベントを表し、何かが発生する必要があるため、何かが発生する可能性は100%です。
同様に、セット確率有するである比例試料空間の確率。グラフィカルに言えば、ため、の測定(確率)はよりも小さくなければなりません。同じ推論が集合も有効です。このセットは測定でき、その測定値はです。P (A )Ω A ⊂ Ω A P (A )P (Ω )A ∩ B P (A ∩ B )
今が起こったと言われたら、があなたの「新しい」かのように考えなければなりません。場合あなたの「新しい」です、あなたはすべてがセットで行われていることを確認し、100%することができ。B Ω B Ω B
そして、それはどういう意味ですか?つまり、「新しい」コンテストで、「新しい」サンプルスペースで表現する必要があることを考慮して、すべての確率尺度を再スケーリングする必要があることを意味します。。それは単純な割合です。B
あなたが言うとき、あなたの直感はほとんど正しいです:
P(A | B)の確率は、単純にA交点Bの確率に等しくなります。
「ほぼ」は、サンプルスペースが変更され(現在はなっている)、それに応じてを再スケーリングしたいという事実によるものです。P (A ∩ B )
は、サンプル空間が現在である新しい世界でのです。言葉であなたはそれをこのように言うだろう(そしてセットで画像上にそれを視覚化してみてください):
新しい世界では、の測度との測度の比率は、の測度との測度の比率と同じでなければなりません。
最後に、これを数学言語で翻訳します(単純な割合):
また、 、次のようになります。
次の問題について簡単に考える直感がわかります。
10個のボールがあるとします。6個の黒と4個の赤です。黒のボールのうち3個がすばらしく、赤のボールのうち1個だけがすごいです。黒のボールも恐ろしいでしょうか?
答えは非常に簡単です。合計6個のブラックボールのうち3個の素晴らしいブラックボールがあるため、50%です。
これは、確率を問題にマッピングする方法です。
条件付き確率式の基本的な直観のために、私は常に双方向テーブルを使用するのが好きです。年間グループに150人の学生がいて、そのうち80人が女性、70人が男性で、それぞれ1つの言語コースを勉強する必要があるとします。異なるコースを受講する学生の双方向表は次のとおりです。
| French German Italian | Total
-------- --------------------------- -------
Male | 30 20 20 | 70
Female | 25 15 40 | 80
-------- --------------------------- -------
Total | 55 35 60 | 150
学生がイタリア語コースを受講する場合、女性である可能性はどのくらいですか?イタリア語コースには60人の学生がいますが、そのうち40人はイタリア語を勉強している女性です。
ここで、はセットカーディナリティー、つまり含まれるアイテムの数です。我々が使用するために必要なことに注意してください分子内だけでなく後者は、他の40を含むすべての80人の女性を、含まれているであろうため、イタリア語を勉強しない人。
しかし、質問がひっくり返された場合、学生が女性であると仮定して、学生がイタリア語コースを受講する確率はどのくらいですか?その後、80人の女子学生のうち40人がイタリア語コースを受講します。
これが理由の直観を提供することを願っています
分数がカーディナリティではなく確率で記述できる理由を理解することは、同等の分数の問題です。たとえば、イタリア語を勉強している学生が女性である確率に戻りましょう。合計150人の学生がいるため、学生が女性でイタリア語を学習する確率は40/150(これは「共同」確率)であり、学生がイタリア語を学習する確率は60/150(これは「限界」確率です) )。結合確率を限界確率で割ると、次のようになることに注意してください。
(分数が等しいことを確認するには、分子と分母に150を掛けると、それぞれの「/ 150」が削除されます。)
より一般的には、サンプリングスペースカーディナリティがこの例ではカーディナリティは150でした、次のことがわかります。
ベン図は確率を表すのではなく、イベント空間のサブセットの尺度を表します。確率は、2つのメジャー間の比率です。Xの確率は、「Xを構成するすべてのもの」のサイズを「検討中のすべてのイベント」のサイズで割ったものです。確率を計算するときはいつでも、「成功スペース」と「人口スペース」の両方が必要です。成功スペースの「大きさ」だけに基づいて確率を計算することはできません。たとえば、2つのサイコロで7を振る確率は、7を振る方法の数を2つのサイコロを振る方法の総数で割ったものです。7を振る方法の数を知っているだけでは、確率を計算するのに十分ではありません。P(A | B)は、「AとBの両方が発生する」という尺度の比率です。スペースと「B発生」スペースの測定。それが「|」意味:これは、「これの後に来るものを人口空間にする」ことを意味します。
これについて考える最良の方法は、段階的なパスを描くことだと思います。
イベントBをフェアダイスでを振るとして説明しましょう。これは、確率を持つことが簡単に示されます。次に、イベントAを、標準の52枚のカードデッキからエースを引くものとして説明します。これは、確率を持つことが簡単に示されます。
さあ、ダイスを振ってカードを選ぶ実験を実行しましょう。したがって、は、すでにロールしたので、エースを引く確率になります。画像を見ると、これはパス(上へ)、次にパス(上へ)になります。
直観的には、総確率空間はすでに与えられたものです:転がします。我々は無視することができと、それは我々が圧延することを説明したので、初期ダウンパスリードを。乗算の法則により、合計空間は。
さて、を出したエースを引いた確率はどれくらいですか?パスを使用した答えはであり、これを合計スペースで割る必要があります。我々が得るよう
執筆時点では、最も重要な点を見逃していると思われる約10の回答があります。あなたは本質的に正しいです。
その場合、P(A | B)の確率は、イベントが発生する唯一の方法であるため、A交差点Bの確率と単純に等しくなりませんか?
これは間違いなく真実です。これは、を定義する量が実際に再スケーリングされる理由を説明しています。
私は何が欠けていますか?
これは非常に特定のイベントであり、は1未満になる可能性があるため、Bが満たされた場合にBが満たされる確率は1であることを忘れています。は、予想どおり、Bが1に等しい場合にBの条件付き確率を作成します。実際、これはさらに良く、マップ確率にします。したがって、条件付き確率は実際には確率です。
確率を推定するための具体的なデータがあれば、より直感的だと思います。
mtcars
例としてデータを使用してみましょう。データは次のようになります(シリンダーの数と送信タイプのみを使用します)。
> mtcars[,c("am","cyl")]
am cyl
Mazda RX4 1 6
Mazda RX4 Wag 1 6
Datsun 710 1 4
Hornet 4 Drive 0 6
...
...
Ford Pantera L 1 8
Ferrari Dino 1 6
Maserati Bora 1 8
Volvo 142E 1 4
クロステーブルを実行することで、2つの変数の共同分布を計算できます。
> prop.table(table(mtcars$cyl,mtcars$am))
0 1
4 0.09375 0.25000
6 0.12500 0.09375
8 0.37500 0.06250
同時確率は、2つの変数を同時に考慮することを意味します。たとえば、4気筒およびマニュアルトランスミッションの車の台数を尋ねます。
ここで、条件付き確率になります。条件付き確率を説明する最も直感的な方法は、データのフィルタリングという用語を使用することです。
を取得する場合、次の推定を行います。
> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))
0 1
0.2727273 0.7272727
これはつまり、4気筒の車しか気にしないということです。そこで、その上でデータをフィルタリングします。フィルタリング後、そのうちのいくつが手動送信であるかを確認します。
条件付きのthisと前述のジョイントを比較して、違いを感じることができます。
もしはA
のスーパーセットだったB
確率はA
常に1その与えられて起こるB
、すなわち、起こりましたP(A|B) = 1
。ただし、B
それ自体の確率は1よりもはるかに小さい場合があります。
次の例を考えてみましょう。
x
は1..100の自然数、A
は「x
偶数」B
「x
10で割り切れる」それから:
P(A)
0.5P(B)
0.1 それx
が10で割り切れる(つまりx
inであるB
)ことを知っている場合、それも偶数(つまりx
in A
)であることがわかりP(A|B) = 1
ます。
ベイズの規則から:
(特殊)ケースでは、偶数と10で割り切れる数の両方の確率は、10で割り切れる数の確率と等しいことに注意してください。したがって、そしてこれをベイズの規則に戻すと、ます。x
x
非縮退の例については、たとえば、A
「x
7で割り切れる」およびB
「x
3で割り切れる」であると考えてください。するとP(A|B)
、「x
3で割り切れることがわかっていると仮定すると、(7)で割り切れる確率は何ですか?」または、「3、6、...、99のどの部分が7で割り切れるのか」と同等ですか?
あなたの最初の声明は誤解かもしれません。
あなたが書いた:
Bが発生すると、Aが発生する条件付き確率の式は次のとおりです。
あなたのフレージングから、「最初のBが起こり、次にAが起こる確率を計算したい」という2つのイベントがあるかのように聞こえます。
これはそうではありません。(誤解があったかどうかにかかわらず、以下が有効です)。
イベントは1つだけであり、4つの可能性のいずれかで説明されます。
どちらも。
ちょうど、ではない。
ではなく、ただ ;
と両方。
いくつかの例を挙げて、
その次の
最初(イベントの知識なし)、を知っていました。
しかし、が発生したことがわかれば、別の場所にいます。は半分なので、与えられた場合の確率は、はです。が起こったことを知っているではありません。
条件付けの確率は、交差の確率と等しくありません。直観的な答えは次のとおりです。
1):「が起こったことを知っていますが起こる確率はどのくらいですか?」
2::「またはが発生したかどうかはわかりません。両方が発生する確率はどのくらいですか?
違いは、最初のものには追加情報があることです(が最初に発生することがわかっています)。2番目のものでは、何も知りません。
2番目の確率から始めて、最初の確率を推定できます。
と両方が発生するイベントは、次の2つの方法で発生します。
1)の確率の確率と仮定起こりました。
2)の確率の確率と仮定起こりました。
両方の状況が同様に発生する可能性があります。(私は直感的な理由を見つけることができません)。したがって、両方のシナリオに重みを
ここで、とが独立していることを使用し、両方のシナリオが等しく発生する可能性があることを覚えておいてください。
Tadaaa ...コンディショニングの確率を分離します!
ところで。誰かがシナリオ1と2が等しい理由を説明できればと思います。鍵はそこにあります。