これはおそらく回答の性質上、正確ではありますが、おそらくそれほど有用ではありません。HorvitzとThompson(1952)は、この状況全般をカバーする結果を提供しています。これらの結果は、予想される組み合わせ表現の観点から示されています。
それらの表記法との一貫性を保ち、より広く使用されている表記法とよりよく対応するために、いくつかの数量を再定義させてください。してみましょう母集団内の要素の数であるとサンプルサイズです。Nn
ましょう、、表す与えられた値を持つ母集団の要素、、と選択の確率。サイズ特定のサンプルについて、サンプルの観測値をます。uii=1,...,NNVii=1,...,Np1,...,pNnv1,...,vn
必要なのは、サンプル合計の平均と分散です
∑i=1nvi.
コメントで述べたように、特定のサンプルをこの順序で選択する確率は
ここでを描画する最初の確率 はによって与えられ、 を描画する2番目の確率はを母集団から削除したことを条件とします。したがって、引き続く各ユニットは、次のユニットの新しい確率分布になります(したがって、それぞれが異なる分布を表すため、異なる添字の選択)。s={ui,uj,...,ut}
Pr(s)=pi1pj2⋯ptn,
pi1uipipj2ujui
あります
母集団全体のうちを含む
サイズサンプル。これはを考慮に入れていることに注意してくださいサンプルの順列。
S(i)=n!(N−1n−1)
nuin!
がを含むサイズ特定のサンプルを示すとしましょう。次に、要素を選択する確率は、与えられます
ここで、合計は次のサイズのセットを超えていますすべての可能なサンプルはサイズの含有する。(混乱を招くように表記を紙から少し変更しました。)s(i)nnuiui
P(ui)=∑Pr(s(i)n),
S(i)s(i)nnui
同様に、定義します
は、と両方を含むサンプルの数として。次に、両方を含むサンプルの確率をとして定義できます
ここで、合計はサイズのセット全ての可能性のあるサンプルのサイズの含有すると。
S(ij)=n!(N−2n−2)
uiujP(uiuj)=∑Pr(s(ij)n),
S(ij)s(ij)nnuiuj
次に、期待値はとして導出されます
E(∑i=1nvi)=∑i=1NP(ui)Vi.
分散は論文で明示的に導出されていませんが、番目のモーメントの
期待値から取得できます
と外積
q
E(∑i=1nvqi)=∑i=1NP(ui)Vqi
E(∑i≠jnvivj)=∑i≠jP(uiuj)ViVj.
言い換えると、これらの計算を行うには、すべての可能なサブセットを調べる必要があるように見えます。たぶん、これはより小さな値に対して行うことができます。n
Horvitz、DGおよびThompson、DJ(1952)有限宇宙からの置換なしのサンプリングの一般化。Journal of the American Statistical Association 47(260):663-685。