私が持っていると仮定し、パラメータのポアソン分布から確率変数をIID。ことを考えると、正確確率何であるのゼロですか?
-
私のアプローチ:あり、がゼロである結合確率質量関数を検討することから始めましたが、続行する方法がわかりませんここから。二項モデルを使用してk個のゼロがある確率を計算する場合、の合計に制約を課す方法がわかりません。
私が持っていると仮定し、パラメータのポアソン分布から確率変数をIID。ことを考えると、正確確率何であるのゼロですか?
-
私のアプローチ:あり、がゼロである結合確率質量関数を検討することから始めましたが、続行する方法がわかりませんここから。二項モデルを使用してk個のゼロがある確率を計算する場合、の合計に制約を課す方法がわかりません。
回答:
してみましょう。条件とするの分布が多項式(運動)であることを確認します。これにより、問題を考えるための概念的に簡単な方法が提供されますボックスがあり、その中にランダムに個のボールを投げます。が空である確率はどれくらいですか?
さて、まず第一に、制限なしにボックスにボールを投げる通りの方法があります。
数を数えるだけの場合でも、少し複雑になります。空のままのボックスを選択するには、通りの方法があります。次に、各ボールが空にならないように、残りの個のボックスに投げるボールを残します。これは、スターリング番号/math/550256/stirling-numbers-of-second-typeの証明と同様に、包含/除外によって実行できます。
これらの成分を組み合わせると、望ましい確率が得られます。 、。
は回答に含まれていないことに注意してください。
興味がなく、簡単な練習として、これをコーディングして(Googleで見つけたスターリング数関数を借りて)、答えがどのようになるかを確認しました。
##-- Stirling numbers of the 2nd kind
##-- (Abramowitz/Stegun: 24,1,4 (p. 824-5 ; Table 24.4, p.835)
##> S^{(m)}_n = number of ways of partitioning a set of $n$ elements into $m$
##> non-empty subsets
Stirling2 <- function(n,m)
{
## Purpose: Stirling Numbers of the 2-nd kind
## S^{(m)}_n = number of ways of partitioning a set of
## $n$ elements into $m$ non-empty subsets
## Author: Martin Maechler, Date: May 28 1992, 23:42
## ----------------------------------------------------------------
## Abramowitz/Stegun: 24,1,4 (p. 824-5 ; Table 24.4, p.835)
## Closed Form : p.824 "C."
## ----------------------------------------------------------------
if (0 > m || m > n) stop("'m' must be in 0..n !")
k <- 0:m
sig <- rep(c(1,-1)*(-1)^m, length= m+1)# 1 for m=0; -1 1 (m=1)
## The following gives rounding errors for (25,5) :
## r <- sum( sig * k^n /(gamma(k+1)*gamma(m+1-k)) )
ga <- gamma(k+1)
round(sum( sig * k^n /(ga * rev(ga))))
}
pmf<-function(n,t,k) {
if (t >= (n-k) & n >= k) {
(choose(n,k) * factorial(n-k) * Stirling2(t,n-k) )/(n^t)
} else {
0
}
}
lambda <- 1
n <- 10
reps <- 500000
set.seed(2017)
X <- matrix(ncol=n,nrow=reps,data=rpois(n*reps,lambda))
K <- apply(X, 1,function(x){sum(x == 0)})
hist(K)
# restrict only to those that sum to t
Y<-rowSums(X)
t<-8
G<- (Y == t)
sum(G)
k <- 5
#head(X[which(K==k),])
#head(Y[which(K==k)])
#head(X[G,])
#head(Y[G])
posskvalues <- (n-t):n
nk <- length(posskvalues)
empP <- numeric(nk)
thP <- numeric(nk)
for(i in 1:nk) {
k <- posskvalues[i]
# sum(K[G] == k)
empP[i] <- sum(K[G] == k)/sum(G)
thP[i] <- pmf(n,t,k)
}
plot(posskvalues,empP,main=paste("n=",n,", t=",t))
points(posskvalues,thP,pch="x")
は、パラメーター持つポアソン確率変数です。したがって、式を書き留めることができます。
ゼロである変数のセットには、選択肢があります。特定のセットを選びます。次に、補完的な変数のセットの合計は、パラメーター持つポアソン確率変数であり、は選択された変数から独立しています。したがって、独立性を使用して式を書き留めることができます
、
選択された変数は、
選択されたはゼロAND選択されたはゼロANDです。
ここからもらえますか?二項分布が含まれるべきではありません...