他の統計の本が何であるかは言うまでもありませんが、有限の人口サンプリングに関する本(またはセクション)であると思います。
いつサンプルのランダム変数、すなわちあなたは、セットを考えると
のの確率変数は、あなたがいることを知って、彼らは独立している場合、、および同じように分散されています。特に、すべてのについておよび場合、
ここで、は2番目です中心の瞬間。 N F (X 1、··· 、XのN)= F (X 1)⋯ F (X N) E (X I)= μ ヴァー(X I)= σ 2 I ¯ X = Σ i X iX1,…,Xnnf(x1,…,xn)=f(x1)⋯f(xn)E(Xi)=μVar(Xi)=σ2i σ2
X¯¯¯¯=∑iXin,E(X¯¯¯¯)=μ,Var(X¯¯¯¯)=σ2n
σ2
有限母集団のサンプリングは多少異なります。母集団のサイズが場合、置換なしのサンプリングでは、サイズサンプルがあり、それらは同等である可能性があります
たとえば、および場合、サンプル空間は
および可能性のあるサンプルは次のとおりです。
N(Nn) n p (s i)= 1sin
p(si)=1(Nn)∀i=1,…,(Nn)
N=5n=3{s1,…,s10}、SIE[X]s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
各個体の出現回数を数えると、それらが6個であることがわかります。つまり、各個体は同じ選択のチャンス(6/10)を持っています。したがって、各は2番目の定義によるランダムサンプルです。個人は、ランダムな変数ではありませんので、大雑把に、それはiid確率サンプルではありません:あなたは一貫して推定することができる。サンプルの平均ではなく、その正確な値を知ることはありませんが、あなたが
できる場合は、正確な人口の平均を知って(LET繰り返します:おおよそ。)
siE[X]n=N1
してみましょう、いくつかのpolulation平均(平均身長、平均収入、...)とします。場合
あなたが推定できる確率変数のサンプルのように:
が、サンプルを平均分散が異なります:
ここで集団準分散である:
。係数は、通常「有限母集団補正係数」と呼ばれます。N < N μ ¯ Y S = N Σ iは= 1、Y I、μn<Nμヴァー(¯ Y、S)= 〜σ 2
y¯¯¯s=∑i=1nyi,E(y¯¯¯s)=μ
〜σ 2Σ N iは= 1(YI- ¯ Yの)2Var(y¯¯¯s)=σ~2n(1−nN)
σ~2(1−n/N)∑Ni=1(yi−y¯¯¯)2N−1(1−n/N)
これは、(ランダム変数)iidランダムサンプルと(有限母集団)ランダムサンプルがどのように異なるかを示す簡単な例です。統計的推論は主にランダム変数サンプリングに関するものであり、サンプリング理論は有限母集団サンプリングに関するものです。
1電球を製造していて、その平均寿命を知りたいとします。少なくとも電球を製造し続けている場合、「人口」は単なる理論上のまたは仮想的なものです。したがって、データ生成プロセスをモデル化する必要があります電球のセットを(ランダム変数)サンプルとして解釈します。1000個の電球の箱を見つけて、それらの平均寿命を知りたいとします。少数の電球(有限の人口サンプル)を選択できますが、それらすべてを選択できます。小さなサンプルを選択した場合、これは電球をランダム変数に変換しません。「すべて」と「小さなセット」の選択はユーザー次第であるため、ランダム変数はユーザーによって生成されます。ただし、有限の人口が非常に大きい場合(国の人口など)、「すべて」を選択できない場合は、2番目の状況を最初の状況として処理する方が適切です。