タグ付けされた質問 「finite-population」

1
有限補正係数の説明
有限の母集団からサンプリングし、標本サイズが母集団の5%を超える場合、次の式を使用して標本の平均誤差と標準誤差を修正する必要があることを理解しています。 FPC=N−nN−1−−−−√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} ここで、は母集団のサイズで、はサンプルサイズです。nNNNnnn この式について3つの質問があります。 しきい値が5%に設定されているのはなぜですか? 公式はどのように導き出されましたか? このペーパー以外に、この公式を包括的に説明する他のオンラインリソースはありますか?

3
ブートストラップ:オーバーフィットの問題
元の観測値からそれぞれサイズサンプルを置き換えて描画することにより、いわゆるノンパラメトリックブートストラップを実行するとします。この手順は、経験累積分布関数による累積分布関数の推定と同等であると思います。BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function そして、連続した推定累積分布関数回から回の観測値をシミュレートして、ブートストラップサンプルを取得します。nnnBBB 私がこれに正しければ、経験的累積分布関数には約N個のパラメーターがあるため、過剰適合の問題に対処する必要があります。もちろん、漸近的に母集団cdfに収束しますが、有限サンプルについてはどうでしょうか?たとえば、100個の観測値があり、2つのパラメーターを使用してcdfをとして推定する場合、心配する必要はありません。ただし、パラメーターの数が100に達する場合、まったく妥当とは思えません。N(μ,σ2)N(μ,σ2)N(\mu, \sigma^2) 同様に、標準の多重線形回帰を使用する場合、誤差項の分布はとして推定されます。残差のブートストラップに切り替えることにした場合、エラー項の分布を処理するためだけに約 n個のパラメーターが使用されることに気づかなければなりません。N(0,σ2)N(0,σ2)N(0, \sigma^2)nnn この問題に明示的に対処しているいくつかの情報源を教えてもらえますか、間違っていると思われる場合はなぜ問題ではないのか教えてください。

4
実際のアプリケーションで、置換なしのサンプリングを検討するのはなぜですか?
置換ありのサンプリングには、置換なしのサンプリングよりも2つの利点があります。 1)有限母集団の修正について心配する必要はありません。 2)母集団の要素が複数回描画される可能性があります。測定値をリサイクルして時間を節約できます。 もちろん、アカデミックPOVから、両方の方法を調査する必要があります。しかし、実用的なPOVから、置換ありの利点を考慮して、置換なしのサンプリングを検討する理由がわかりません。 しかし、私は統計の初心者なので、少なくとも特定のユースケースでは、置換なしの方が優れた選択肢である理由はたくさんあります。混乱させないでください!

1
ベイズの定理を使用する場合の信頼区間
いくつかの条件付き確率と、95%の信頼区間を計算しています。私のケースの多くでは、(分割表からの)試行からのx成功の単純なカウントがあるnため、で提供さbinom.confint(x, n, method='exact')れてRいるような二項信頼区間を使用できます。 しかし、他の場合では、そのようなデータがないので、ベイズの定理を使用して、持っている情報から計算します。たとえば、イベントおよび与えられた場合:baaabbb P(a | b )= P(B |)⋅ P(a )P(b )P(a|b)=P(b|a)⋅P(a)P(b) P(a|b) = \frac{P(b|a) \cdot P(a)}{P(b)} \ textrm {binom.confint}(\#\ left(b \ cap {} a)、\#(a)\ right)を使用してP(b | a)の周りの95%信頼区間を計算でき、比率P(a)/ P(b)を周波数比\#(a)/ \#(b)として。この情報を使用してP(a | b)の周囲の信頼区間を導出することは可能ですか?P(b | a )P(b|a)P(b|a)binom.confint(#(B ∩a )、#(a ))binom.confint(#(b∩a),#(a))\textrm{binom.confint}(\#\left(b\cap{}a),\#(a)\right)P(a )/ P(b )P(a)/P(b)P(a)/P(b)#(a )/#(b )#(a)/#(b)\#(a)/\#(b)P(a | b )P(a|b)P(a|b) ありがとう。

1
有限母集団からのサンプルのブートストラップ
誰かが、既知のサイズの母集団から取得したサンプルをブートストラップすることについての理論の参照を私に指摘できますか? 私は、人口のサイズがサンプルよりもはるかに大きいと考えられる場合に、Bootstrapを使用してサンプルの信頼区間を計算することに慣れています(したがって、繰り返しによるランダムな選択は、サンプリングプロセスをうまくエミュレートするはずです)。 人口が1000で、800をサンプリングしたことがわかったとしましょう(サンプリングが実際にランダムであると仮定しましょう)。繰り返しを伴うランダム選択は適切ではないようです。ピジョンホールの原理により、サイズ800の別のランダムサンプルを実際に取得すると、少なくとも600の値が元のサンプルと同じであることが保証されます。 解決策はありますか?私は考えました: 繰り返しで1000をサンプリングし、ランダムに800を選択します(従来のブートストラップと同等のアプローチのようです) 繰り返しなしのサンプル600では、繰り返しありの800サンプルすべてを使用して200をさらにサンプリングします。これは、私が前に説明した効果を説明します。 これらのアプローチの良い点と悪い点について何か考えはありますか?または別のアプローチ?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.