同じ母集団の複数のサンプリングからの交差の確率


10

次に例を示します。

  • 人口は10,000アイテムです。各アイテムには一意のIDがあります。
  • 100個のアイテムをランダムに選び、IDを記録します
  • 100アイテムを人口に戻しました
  • 私は再びランダムに100アイテムを選び、IDを記録して置き換えます。
  • 合計で、このランダムサンプリングを5回繰り返します

個のアイテムが5つのランダムサンプリングすべてに現れる確率はどのくらいですか?X

私は統計に精通していません。場合、これは正しいでしょうか?X=10

  • 各サンプリングのために、10,000〜100個のアイテムの可能な組み合わせの数は、binom(10000,100)
  • 100個のアイテムのすべての可能な組み合わせのうち、の組み合わせが10個の特定の項目を含みますbinom(9990,90)binom(100,10)
  • 10個の特定のアイテムを有する確率である(binom(9990,90)binom(100,10))/binom(10000,100)
  • 計算された5の累乗の確率は、5つの独立したサンプリングを表します。

つまり、基本的には5つの独立した超幾何確率を計算し、それらを掛け合わせるだけなのでしょうか。足元が足りないような気がします。


3
何かを1回繰り返すと、それは全部で2回繰り返すことを意味します。何かを5回繰り返すことは、6回繰り返すことを意味しませんか?
Glen_b-2015

回答:


3

確率を再帰的に計算します。

ps(x)x0xks1knk>0nk

ps(xy)ys1xy(yx)xy(nykx)kxny

ps(xy)=(yx)(nykx)(nk).

全確率の法則が主張する

ps(x)=y=xkps(xy)ps1(y).

s=1x=k

sO(k2s)Rlog(ps(x))1,2,,s

lp <- function(s, n, k) {
  P <- matrix(NA, nrow=k+1, ncol=s, dimnames=list(0:k, 1:s))
  P[, 1] <- c(rep(-Inf, k), 0)
  for (u in 2:s) 
    for (i in 0:k) {
      q <- P[i:k+1, u-1] + lchoose(i:k, i) + lchoose(n-(i:k), k-i) - lchoose(n, k)
      q.0 <- max(q, na.rm=TRUE)
      P[i+1, u] <- q.0 + log(sum(exp(q - q.0)))
    }
  return(P)
}
p <- function(...) zapsmall(exp(lp(...)))

s=5, n=10000=104k=100=102101×5xx=0,1,2,3

p(5, 1e4, 1e2)[1:4, ]

出力は

  1         2         3      4        5
0 0 0.3641945 0.9900484 0.9999 0.999999
1 0 0.3715891 0.0099034 0.0001 0.000001
2 0 0.1857756 0.0000481 0.0000 0.000000
3 0 0.0606681 0.0000002 0.0000 0.000000

xs

これらの可能性がどれだけ小さいかを知りたい場合は、その対数を見てください。基数10は便利で、多くの桁は必要ありません。

u <- lp(5, 1e4, 1e2)[, 5]
signif(-u[-1] / log(10), 3)

出力から、小数点の後にゼロがいくつあるかがわかります。

    1     2     3     4     5     6     7     8     9    10  ...   97    98    99   100 
  6.0  12.3  18.8  25.5  32.3  39.2  46.2  53.2  60.4  67.6 ... 917.0 933.0 949.0 967.0 

xexp(u[4])0.000000000000000000143441918967.0967.26(10000100)410967.26.


0

私は同様の問題に遭遇し、これが正しい解決策であるかどうかもわかりませんが、次のように対処しました:

X10010,000X10,000X100phX5p=ph5

ph55p=(55)ph5(1ph)55=ph5


0

X個のアイテムが5つのランダムサンプリングすべてに現れる確率はどのX

XXXXXP=(XX)(10000X100X)(10000100)P5

X(10000X)X(10000X)P5


x

3年前のように覚えていませんが、おそらく質問と同じXでしょうか。
Hao Ye

X=01
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.