10,000回の試行で1回だけ発生する10000:1の確率


8

ランダムイベントの「可能性」と、実際に発生する可能性があると言われている正確な確率で実際に発生する特定の確率との違いを理解することに興味があります。つまり、イベントに10000分の1の確率がある場合、10000回の試行で正確に1回発生する可能性は2回ではなく、0回ではなく、3回ではなく、等々であり、どのように表現(および説明)するか偏差?

イベントの確率が1:10,000の場合、10万回の試行で10回発生する可能性があります。1,000,000回の試行では、100回発生する可能性がありますが、1,000,000回の試行の任意のセットで何度も発生する可能性はそれほど高くありません。たとえば、98回、99回、101回、96回、102回など

統計的に言えば、特定の結果が実際に1:10000であり、1:9999や1:10001や1:10000.5などではないという統計的確実性に近づくために、平均化して説明しなければならない試行の数は?


1)「統計的確実性」とはどういう意味ですか?2)「可能性」は、統計で特定の技術的な意味を持っていますが、あなたが意図しているとは思えません。確率を意味する場合は、代わりにその単語を使用してください。
Glen_b-2015

正確に....「可能性」と「確率」という2つの用語の正確な技術的意味がわからない...私が言っていることは、確率が1:10000(または確率が何であれ)であると思うしかし、その可能性のあるものをランダムに描いたとしても、それが必ずしも1万回に1回の確率で正確に成立するとは限りません。そして、「統計的確実性」について...経験的データが1:10000であると考えられているものが実際に1:9999または1:10001であることを示している場合、何かの実際の確率を決定するために何回の試行が必要でしょうか。
RobH 2015年

返信ありがとうございます。サンプルサイズが大きくなると、つまり10,000,000回、100,000,000回など、予想される結果が10,000あたり1に近づく、または常に確率があると思います。同様の偏差の....
RobH 2015年

はい、10000分の1にさらに近づきます。試行回数が増えると(10000をはるかに超えて増加すると想定します)、サンプルの比率は真の(母集団)の比率に集中します。標本比率の分布の標準偏差(その標準誤差)は、に比例して減少します。実際、が大きい(ここでも、実質的に10000を超える)場合、内の確率の約95%になります np±11nnp±1n
Glen_b -Monica

答えてくれてありがとう...さて、要点を踏みにじるリスクがあるので、フォローアップをお願いしましょう... 10,000,000,000回の試行の後、結果が999,982回発生したとすると、次の試行の確率は1:9999.82または1:10000または偏差を含むいくつかの計算結果?..(または、精度がはるかに低い10,000回のトライアルを1セットだけ行った後も、同じことが尋ねられると思います!)
RobH

回答:


16

10000分の1の確率、10000回の試行で正確に1回発生する可能性の 確率

1/e0.3679、オッズにならない限り近く。(正確に0回発生する確率はほぼ同じです。)

編集:マークLストーンがかなり正しく指摘しているように、私はあなたの質問を、それが事実であることを証明することなく、裁判が独立していることを示唆していると考えました。これは重要な仮定です(多くの状況では妥当でない場合があります)。それでもあなたの意図であったと私は考え続けるので、私はその根拠に基づいて答え続けます。

同じことは、十分に大きい、回の試行と確率にも当てはまります。1 / n nn1/nn

確率(大きな)は次のようになります( = 10000の場合を示します)。nnn

ここに画像の説明を入力してください

イベントの確率が1:10,000の場合、10万回の試行で10回発生する可能性があります。1,000,000回の試行では、100回発生する可能性がありますが、1,000,000回の試行の任意のセットで何度も発生する可能性はそれほど高くありません。たとえば、98回、99回、101回、96回、102回など

完全ではありません:99と100は同じ確率ですが、他のすべての確率は低くなります。

ここに画像の説明を入力してください

(あなたがさらに離れるにつれて、確率は下がり続けます)。

n=1000000p=1/10000

npλ=np=100

特定の結果が実際には1:10000であり、1:9999または1:10001ではないという統計的確実性に近づくために、平均化して説明しなければならない試行の数

あなたはそれに任意に近づくことができますが、それとは異なるので、それが実際に 1/10000であるとは確信できません。

nnpnp(1p)np

p=1/10000n=1012108104p=1/9999100,010,000n=4×10122n=1013

1013p=1/100001/9999

p(1/p)3p=1/(k±1)1/k

10,000,000,000回の試行後に結果が999,982回発生した場合、次の試行の確率が1:9999.82または1:10000であるか、または偏差を含む計算結果であると述べますか?..(または、1セットの10,000回のトライアルの後に、はるかに低い精度で同じことが求められると思います!)

はい、それは10000回のトライアルまたは1000回または100回で尋ねられる可能性があります。

物事を単純化して、10000回の試行と98回の成功を収めましょう。もちろん、成功の確率のポイント推定値として98/10000 = 0.0098を使用することもできますが、これは実際には基本的な比率ではなく、単なる推定値です。0.944 ...、0.997 ...、または他の任意の数の値になる可能性があります。

したがって、人々が行うことの1つは、観測された比率と(ある程度の意味で)合理的に一致する値の間隔を作成することです。統計には2つの主要な哲学(ベイジアン統計および頻出統計)があり、通常、大きなサンプルでは同様の間隔が生成される傾向がありますが、解釈は異なります。

p

典型的なベイジアン間隔は、値に関する不確実性を表すパラメーターの事前分布から始まり、データを使用してその知識を事後分布に更新し、そこから信頼できる間隔を取得します

信頼区間は非常に広く使用されています(信頼できる区間は、区間が何をするべきかについてのあなたの期待に近づくかもしれませんが)。以下の場合、二項比例信頼区間大きなサンプルでは、彼らはすべてほとんど同じ間隔をあなたを与えるものの、ここのように、様々なアプローチは、あります。

サイコロが6 x 10 ^ 9の試行であっても、6つの結果のそれぞれに対して正確に1 x 10 ^ 9になるとは限りません

正しい; あなたはそれを試すたびに(かなりサイコロで)999994万から10億06百万の間の成功を期待するでしょう(ほとんどではありませんが)。

実際の確率が1:10000の場合、予想される偏差内で試行を増やすと、

それはほとんど常にそれと(そして他の近くの値の範囲と)一貫しているでしょう。何が起こるかは、1/10000であるとは言えませんが、サンプルサイズが大きくなるにつれて、結果と一致する確率値の間隔が狭くなるということです。


Glen_b、あなたはそれぞれの試みが独立していると仮定しています。それはOPが意図したものである可能性がありますが、OPの確率の洗練度の欠如は、おそらく常に確率に適用できるように、OPが暗黙的に独立の仮定を行っていることを示唆しています。確率が9999/10000でイベントがゼロ試行で発生し、確率で1/10000でイベントがすべての10000試行で発生するような、10000回の試行がある確率変数を考えます。イベントの発生確率は10000分の1で、100000回に1回だけ発生する確率はゼロです。
Mark L. Stone

@ MarkL.Stoneに感謝します-正解です。質問は独立性を意味するものであると考えましたが、私はそれについて完全に明確にすべきでした。回答を明確にするために文を追加します。
Glen_b-モニカの復活2015

このように、各試行が独立しているかどうかの違いを想定します。10,000ビー玉、1レッド、9,999ブラックのコンテナがある場合、最初の試行で赤いビー玉を選択する確率は1:10000です...黒い大理石を描くと、次の試行での赤の確率は1:9999になり、赤い大理石を描くまで続きます。その後、確率は0になります。独立した試行の例では、各大理石は9999個の黒い大理石と1個の赤い大理石の新しいコンテナから取り出されますよね?はい、それは私が説明しようとしていたことです。
RobH 2015年

2

タイトルに基づいてこの質問にたどり着きましたが、イベントの確率を見つけたいと思っていました。p=1nn

n1/e0.632n

説明:

私がサイコロを6回振ったとします。1これらの6回の試行から少なくとも1回取得される確率は次のとおりです。

試行ごとに「1」を取得しない確率:

p=56

6回の試行で「1」を取得しない確率:

p=566

6回に1回以上「1」を取得する確率:

p=15660.665

同様に、イベントの確率がであるとし1/10000ます。このイベントが10000試行のうち少なくとも1回発生する確率は次のとおりです。

p=1999910000100000.634

これを外挿するnと、次のようになります。

イベントの確率p=1nn

p=1(n1n)n

それ以来:

limn+n1nn=limn+(11n)n=1e0.368

私たちはそれを言うことができます:

limn+1n1nn0.632

この方程式をGrapherでプロットすると、次のようになります。

ここに画像の説明を入力してください

結論:これは完璧な理にかなっているが、私は実際には非常にイベントの確率を有するという事実に驚いたのうち後少なくとも起こっ試行はほぼ独立しているのために、としてわずか既に。 nnn3p=1nnnn3


0

サイコロの簡単な問題を確立しましょう。計算することができます尤度 6には、サイコロのスロー確率を、スコアが一度だけ1になります。

これが発生する方法はいくつありますか(およびそれぞれの確率):

1 is scored in first throw but not in any other throws[1/6*5/6*5/6*...] [=3125/46656]
1 is scored in second throw but not in any other throw [5/6*1/6*5/6*...] [=3125/46656]
...
...

したがって、1が6スローに1回だけスコアされる確率の合計は(3125/46656)* 6 = 3125/7776

1 / nの確率でイベントの同じ開発を拡張できます。n回の試行で1回だけ発生するイベントの確率は

((n-1)/n)^(n-1)

これを並べ替えると、少しおなじみに見えるかもしれません。

(1-1/n)^(n-1)

あなたの質問の他の部分:サンプル数が増えるにつれて偏差を減らすことは、別の答えですでに十分に説明されています。


残念ながら、強調表示された回答は正しくありません。
Dilip Sarwate、2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.