エントリーの内訳がわからないときに、マルチエントリーコンテストの勝率を見積もることはできますか？

私は締結していたとコンテスト以下のルールで、：

すべての人が最大6つのエントリを取得できます
すべてのエントリーがプールされ、エントリーの25％が勝者として選択されます（最大25）。
エントリーの数に関係なく、各人は一度だけ勝つことができます。誰かの名前が再び描かれた場合、それは破棄され、新しい名前が描かれます。
持っているエントリの数を知っています（最大6）
エントリの種類ごとに分類された合計エントリ数がわかります
何人のエントリーが同じ人によるリピートエントリーなのかわかりません。

タイプ別のエントリ数は次のとおりです。

タイプ1：42タイプ2：72タイプ3：119タイプ4：217タイプ5：156タイプ6：178

この状況で勝つ確率を見積もることはできますか？各勝者がプールから削除するエントリの数がわからないため、私は初期の勝者が私のチャンスにどのように影響するかを予測できないという事実に少し混乱しています。

私はデータセットが与えられた解決策に興味がありますが、それを計算するための適切な手順/アルゴリズムにも興味があります。

probability

— agent86
ソース

「タイプ」は何を意味しますか？

— マクロ

@Marco獲得できるさまざまな種類のチケット。したがって、宝くじチケットタイプ1〜6を獲得でき、42人がチケットタイプ1を獲得しました

— レイチェル

下から上に実行されるため、一連の投稿をたどることができません。しかし、ポスター名の右側にある時間を考えると、私はそれを理解したと思います。だから、私がこれをまっすぐに持っているかどうか誰かに教えてください。エントリーと参加者のあいまいさのため、whuberの答えは正しくないと思います。最悪のシナリオと最良のシナリオを取得するレイチェルの戦略は正しいですが、彼女は異なる分母に基づくことができる場合はパーセンテージを追加することによって数学エラーを作りました。したがって、そのエラーを修正すると、ソリューションに適切な限界があります。

— Michael R. Chernick

レイチェルが最高のケースのシナリオを最高の勝率と最も悪いケースを最低のものと呼ぶのは奇妙だと思いました。勝つことはいいことですか？明確にしたい最後のポイント：枢機卿は、この場合、応募者の25％が25を超えるため、受賞者は25人だけになると述べています。彼は少なくとも178人が入力されていることを知っていることでこれを取得し、もちろん、参加者の数が100を超えると、ルールに基づいて勝者の合計が25で打ち切られます。

— Michael R.

@cardinalどうやって178という数字を思いついたの？タイプごとにすべてのエントリを追加して合計784を取得しました。私にとって最悪の場合、プレイヤーとしての全員が6エントリを取得し、784/6 = 130.7となりました。したがって、少なくとも130の入り口が必要であると結論付けます。これはまだ25のカットオフが適用されることを意味しますが、どのようにしてより高い数値に到達しましたか？

— Michael R. Chernick

回答:

可能性は17.7％から18.7％です。

最悪のケースは、宝くじにエントリが1つしかない場合に発生します。これは、データと一致する構成です（可能性は低いですが！）。

あなたが勝てない可能性の数を数えましょう。これは、二項係数によって与えられる、残りのチケットからチケットを引き出す方法の数です。（膨大な数です）。可能性の総数は、すべてが公平な抽選で等しく可能性が高いですが、です。比率はに単純化されます。これは約82.22772％で、勝利しない可能性があります。したがって、この状況で勝つ可能性は1-82.22772％= 17.7228％です。 $25$ $784-6$ $\binom{784-6}{25}$ $\binom{784}{25}$ $(784-25)\cdots(784-30) / [(784)\cdots(784-5)]$

宝くじに参加する個人の数ができるだけ少なく、できるだけ多くの人が、次になどのチケットを持っているときに、最良のケースが発生します。「gem」の数が（昇順）であるとすると、これは $6$ $5$ $(42, 72, 119, 156, 178, 217)$

最大人は、それぞれエントリを持つことができます。 $42 = a_6$ $6$
最大人は、それぞれエントリを持つことができます。 $72-42=30 = a_5$ $5$

...
最大人は、それぞれエントリを持つことができます。 $178-156=22 = a_2$ $2$
$217-178=39 = a_1$ 人はそれぞれエントリを持っています。 $1$

ましょう、あなたが保持するときに当選のチャンス指定（間の及びのデータと宝くじ券で）そしてドロー。したがって、チケットの総数はます。次の抽選を考えてみましょう。7つの可能性があります。 $p(\mathbf{a}, l, j)$ $j$ $1$ $6$ $\mathbf{a}=(a_1,a_2,\ldots,a_6)$ $l=25$ $1 a_1 + 2 a_2 + \cdots + 6 a_6 = n$

チケットの1つが抽選されました。あなたが勝ちます。この可能性はと同じです。 $j/n$
他の誰かのチケットが引かれます。この可能性は等しくなります。彼らがを持っている場合、すべてのチケットが宝くじから削除されます。もし、図は新しいデータで続けて：減少してきた及び減少してきた同様。宝くじでチケットを持っている人が選ばれるは、あなたのチケットが選ばれていない場合、と等しくなります。これにより、つのばらばらな可能性が与えられます。 $(n-j)/n$ $i$ $i$ $l \ge 1$ $l$ $1$ $a_i$ $1$ $i$ $ia_i/(n-j)$ $i=1,2,\ldots,6$

オーバーラップなしですべての結果を分割するため、これらのチャンスを追加します。

計算は、葉がすべて到達するまで、この確率ツリーを再帰的に続けます。これは大量の計算ですが（約 = 2億4400万回の計算）、数分（プラットフォームによってはそれ以下）しかかかりません。この場合、18.6475％の勝率が得られます。 $l=0$ $25^6$

これが私が使ったMathematicaコードです。（これは、前述の分析に対応するように書かれています。代数の削減とが削減された場合のテストによって、少し効率的になる可能性があります。）ここで、引数は、保持するチケットをカウントしません。誰もが持っているチケットの数の。 $a_i$ $0$ a $j$

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

現実を確認するために、これらの回答を2つの単純な近似（どちらも正しくない）と比較してみましょう。

プレー中の6チケットで25の抽選は、784の勝利のうち約6 * 25を獲得するはずです。これは19.1％です。
勝てない可能性は毎回約（784-6）/ 784です。宝くじに当たらないチャンスを見つけるには、これを25乗します。1から引くと17.5％になります。

私たちは正しい球場にいるようです。

— whuber
ソース

宝くじの確率論的不確実性と宝くじ内のチケット所有権の真の分布に関する知識の欠如という2種類の不確実性の実例を提供するため、この問題が好きです。後者の不確実性は、可能性を可能な限り厳密に制限しようとする間隔分析を使用して効果的に処理しました。他の人は先に進んで、この認識論的不確実性を説明するためにいくつかの事前分布を採用するかもしれませんが、手元の情報を考慮して、そのような事前分布を正当化する有効な方法はないと思います。

— whuber

ただし、特定のタイプのチケット（「gem」）を2つ以上持つことはできないと想定しています。私が見る限り、これは問題のOP（agent86s）の説明には明記されていません。

— Michael R. Chernick

@Michaelその通りです。ゲームのルールでは完全に明確ではありませんが、宝石の各タイプを1つしか収集しないことを強く示唆しています。元の質問のルール1を守ります：「すべての人が最大6つのエントリを取得する可能性があります。」

— whuber

私が知っている限り（そしてコンテスト中に実証されました）、与えられた情報からの仮定は正しいです-1人が各「タイプ」の1つである6を超えるエントリを持つことはできません。

— agent86

お時間を割いていただき、ありがとうございました！私は昨日からこの問題を考えていました。目が覚めたのは、それが私を殺したかどうかを判断するために決心していたからです。すでに投稿されたすばらしい説明を見てうれしいので、今は必要ありません:)

— レイチェル

私が数学で正解した場合、あなたは賞金を獲得するチャンスとその間19.43%に21.15%チャンスがあります

これ19.43%は、すべての参加者が6枚のチケットを持っている最良のシナリオです。

これ21.15%は最悪のシナリオで、すべての参加者があなた以外のチケットを1枚持っています。

どちらのシナリオも非常にありそうもないので、勝利の実際のオッズはおそらくその中間にありますが、勝利のおよそ1/5のチャンスはかなり確かな数字のようです

これらの数値の取得方法の詳細は、このGoogleスプレッドシートに記載されていますが、取得方法をまとめています。

始まるエントリの合計番号（784）とあなたのエントリ（6）
勝つチャンスを得る（6 / 784 = 0.77%）
最良の場合は6を、最悪の場合は1を引きます。 TotalEntries
勝利のチャンスを得る（6/778ベストケースのための6/783最悪の場合のために）
25パーセントになるまで手順3〜4を繰り返します。
25パーセントを合計して、何かを獲得する全体的な可能性を見つけます

簡単な概算のパーセンテージを取得する別の方法を次に示しますが、勝者を引くたびに重複するエントリを削除しないため、正確ではありません。

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

編集：私は数学に何かが欠けていると確信しています、そして私は私が近いと思うが、このようなパーセンテージを単純に追加することはできない（または賞金の数で勝つためにパーセントの確率を掛ける）

Whobarのコメントは、17.4％の勝率を与えますが、彼が与えた式を理解し、コンテストに正確であることを確認する必要があります。おそらく週末のプロジェクトです:)

— レイチェル
ソース

これは6つの宝石があることを前提としていることを指摘しておきます。

— murgatroid99

@ murgatroid99はい、質問に明記されていますI know how many entries I have (the maximum, 6):)勝率を把握したい人なら誰でもスプレッドシートを編集可能にすることができます

— Rachel

私はこれらの数値は一般的には適切な範囲にあると思いますが、数パーセントはずれています。あなたが行った計算の説明が投稿自体に提供されていないので、それを区別することは困難です。

— 枢機卿

あなたの説明から、不一致はおそらく、選択される前に番目のステップに到達する確率を組み込んでいないという事実から生じているようです。たとえば、最悪のシナリオでは、3番目の抽選で選択される確率はです。

k

$k$

(778 \cdot 777 \cdot 6) / (784 \cdot 783 \cdot 782)

$(778\cdot 777\cdot 6)/(784 \cdot 783 \cdot 782)$

— 枢機卿

レイチェル、は、うちチケットを持っている人が、25のときに、少なくとも1つが選ばれる可能性を与えます描かれた。（これは、個人のチケットを引き出すことができなかった方法をカウントし、可能な引き分けの総数で割り、その比率をから差し引くことに基づいています。）の場合、値は17.7％です。これが宝くじの運営方法であるかどうかはわかりませんが。

1 - \frac{(\binom{n - 6}{25})}{(\binom{n}{25})}

$1-\frac{\binom{n-6}{25}}{\binom{n}{25}}$

6

$6$

n

$n$

1

$1$

n = 784

$n=784$

— whuber