十分性について勉強していたときに、私はあなたの質問に出くわしました。なぜなら、私が集めたものから、これが私が思いついたことについての直観も理解したかったからです。
レッツ平均のポアソン分布からのランダムサンプルであってもθ >X1,…,Xnθ>0。
我々はそれを知っているのための十分統計量であるθの条件付き分布するので、X 1、... 、X nは与えられたT (Xが)の自由であるθは、他の言葉では、ありませんθに依存T(X)=∑ni=1XiθX1,…,XnT(X)θθます。
A X1,…,Xn∼i.i.dPoisson(4)n=400、この分布からランダムな値:
n<-400
theta<-4
set.seed(1234)
x<-rpois(n,theta)
y=sum(x)
freq.x<-table(x) # We will use this latter on
rel.freq.x<-freq.x/sum(freq.x)
ABに次のます。
「これらのサンプル値があります x1,…,xn∑ni=1xi=y=4068あなたがこのディストリビューションについて私に言うことができる何を?"
∑ni=1xi=y=4068Bθますか?これが十分な統計であることを知っているので、答えが「はい」であることを知っています。
この意味について理解するために、次のことを行いましょう(Hogg&Mckean&Craigの「Introduction to Mathematical Statistics」、第7版、演習7.1.9から):
Bz1,z2,…,znxZ1,Z2…,Znz1,z2,…,zn∑zi=y
θz1e−θz1!θz2e−θz2!⋯θzne−θzn!nθye−nθy!=y!z1!z2!⋯zn!(1n)z1(1n)z2⋯(1n)zn
Y=∑Zinθyn1/nByz1、… 、zn
これが演習の状態です。それで、それを正確にやってみましょう:
# Fake observations from multinomial experiment
prob<-rep(1/n,n)
set.seed(1234)
z<-as.numeric(t(rmultinom(y,n=c(1:n),prob)))
y.fake<-sum(z) # y and y.fake must be equal
freq.z<-table(z)
rel.freq.z<-freq.z/sum(freq.z)
Z のように見えます(私はまた、ポアソン(4)の実密度をプロットしています K = 0 、1 、... 、13 -13を超えるものは事実上ゼロです-(比較のため):
# Verifying distributions
k<-13
plot(x=c(0:k),y=dpois(c(0:k), lambda=theta, log = FALSE),t="o",ylab="Probability",xlab="k",
xlim=c(0,k),ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(8,0.2, legend=c("Real Poisson","Random Z given y"),
col = c("black","green"),pch=c(1,4))
だから、何も知らない θ 十分な統計のみを知っている Y= ∑ X私 Poisson(4)分布によく似た「分布」を再現することができました( n 増加すると、2つの曲線はより類似します)。
今、比較 バツ そして Z| y:
plot(rel.freq.x,t="o",pch=16,col="red",ylab="Relative Frequency",xlab="k",
ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(7,0.2, legend=c("Random X","Random Z given y"), col = c("red","green"),pch=c(16,4))
同様に(予想どおり)かなり似ていることがわかります。
そのため、「統計的判断を下すために、個々のランダム変数を無視できます。 バツ私 そして、完全に決定を下す Y= X1+ X2+ ⋯ + Xn"(アッシュ、R。「統計的推論:簡潔なコース」、59ページ)。