多項分布の係数の合計


10

私は公平なサイコロを投げています。1、2、または3を取得するたびに、「1」を書き留めます。4を取得するたびに、「2」を書き留めます。5または6を取得するたびに、「3」を書き留めます。

してみましょうNの総数は私はあることを書き留めたすべての数値の積のために必要なスロー可能100000\ P(N \ geq 25)を計算(または概算)したいのですP(N25)が、正規分布の関数として概算を与えることができます。

まず、\ log_3 100.000 \約10.48であるため、P(N11)=1ことがlog3100.00010.48。ここで、abcそれぞれ1、2、3と書き留めた回数とします。次に:

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

私が計算したいのは:

P(a+b+c252b3c100000)

これをどのように計算しますか?

-編集:

だから私は条件を次のものに置き換えることができることが示唆されました:

P(a+b+c25αa+βb+γcδ)

ここで、、、、およびです。α=0β=log2γ=log3δ=log100000

これはもっと解決可能に見えます!残念ながらそれを解決する方法はまだわかりません。


2
+1 whereおよび。αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber

条件を記述するためのこの新しい方法を追加しましたが、残念ながら、これを解決する方法についての手掛かりはまだありません!
Pedro Carvalho

もう1つのヒントは、「2」が回発生した場合は停止するということです。したがって、これをパラメーターと(またと)負の2項で近似できます。組み合わせは多くないため、正確な答えも管理できます。また、条件は正確ではありません-「2」または「3」が番目のロールに記録されたことを含める必要があります17170.5111/3N
確率論的

回答:


1

現在の質問は、多項確率変数の線形関数である量を扱っている特定のケースです。必要な不等式を満たす多項式の組み合わせを列挙し、その範囲の分布を合計することにより、問題を正確に解決することができます。が大きい場合、これは計算上実行不可能になる可能性があります。この場合、多項式の正規近似を使用して近似分布を取得できます。この近似の一般化されたバージョンを以下に示し、これを特定の例に適用します。N


一般的な近似問題:範囲一連の交換可能な確率変数があるとします。任意のについて、カウントベクトルを形成できます。シーケンスの最初の値における各結果の発生。基になるシーケンスは交換可能であるため、カウントベクトルは次のように分散されます。1,2,...,mnNXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

ここで、非負の重みのベクトルあり、これらの重みを使用して線形関数を定義するとします。w=(w1,w2,...,wm)

A(n)i=1mwiXi.

重みは負ではないため、この新しい数量は減少しません。次に、数値定義しますは、線形関数の指定された最小値を取得するために必要な観測の最小数です。この値が(確率的に)大きい場合の分布を近似します。nN(a)min{nN|A(n)a}N(a)


一般的な近似問題の解決:最初に、は減少しないため(すべての重みが負ではないと仮定したため、これは成り立つ)、次のようになります。A(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

したがって、の分布はの分布に直接関連しています。前者の量が多いと仮定すると、離散ランダムベクトルを多変量正規分布からの連続近似で置き換えることにより、後者の分布を近似できます。これにより、線形数量正規近似が得られ、この量のモーメントを直接計算できます。これを行うには、、および for。いくつかの基本的な代数で、これは私たちに与えます:NAXA(n)E(Xi)=nθiV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

多項式の正規近似を行うと、近似分布ます。この近似を適用すると、次のようになります。A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(シンボル標準正規分布関数のための標準的な表記法である。)数量に係る確率を見つけるためにこの近似を適用することが可能であるの指定された値のために。これは、基礎となる多項式カウント値の値に連続性補正を組み込むことを試みていない基本的な近似です。これは、正確な線形関数と同じ最初の2つの中心モーメントを使用して、通常の近似を行うことによって得られます。ΦN(a)a


問題への適用:問題には、確率、重み、およびカットオフ値。したがって、(小数点以下6桁に丸める)ます。上記の近似を適用します(小数点以下6桁に丸めます)。θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729

P(N(a)25)Φ(ln100000240.481729240.499666)=Φ(0.019838)=0.492086.

正確な多項分布を適用して、要件を満たすすべての組み合わせを合計すると、正確な結果がであることを示すことができます。したがって、このケースでは、近似が正確な答えに非常に近いことがわかります。P(A(24)<a)P(N(a)25)=0.483500

うまくいけば、この答えがあなたの特定の質問への答えを与えると同時に、多項ランダムベクトルの線形関数に適用される確率論的結果のより一般的なフレームワーク内に配置することもできます。現在の方法は、あなたが直面している一般的なタイプの問題の近似解を得るのを可能にし、あなたの例の特定の数の変化を可能にするはずです。


0

通常の近似をしてみましょう。

まず、ログで問題を完全に言い換えましょう。時間t = 0で0から開始します。次に、各タイムステップで以下を追加します。

  • 確率1/2で0

  • log(2)確率が1/6の

  • log(3)確率1/3の

合計がを超えたときにこのプロセスを停止します。その時点で、スロー数を確認します。その点に到達するのに要した投球数は ^log(105)N

私の計算機は、あなたの増分の平均は:で、分散​​はであることを私に教えています。参考までに、終点はなので、約24ステップで彼に連絡します。0.480.2511.51

25ステップ実行したという事実を条件として、合計の分布はおおよそ12.0を中心とし、分散が6.25のガウス分布です。これにより、大まかなガウス近似が得られp(N25)0.5

ガウス近似が大丈夫かどうかを知るには、N = 25での和のキュムラントを調べる必要があります。増分が対称的でないことを考えると、近似は最適ではない可能性があります


1
導出を完了できますか?私はそれを見るのに苦労しています。また、それを計算する正確な方法はありませんか?
Pedro Carvalho

1
log(1)とlog(2)がある「log(2)」と「log(3)」という意味ですか?
Glen_b-モニカを復活させる2016

@GuillaumeDehaeneが書きました: ....私の計算では、2つの異なる方法で、 0.5とは非常に異なるp(N25)0.5P(N25)=1P(N24)=1112729185663307164998372267786240.8266
ウルフィー2016年

どのようにしてP(n \ leq24)\約0.18を取得しますか?
Guillaume Dehaene
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.