母集団をどのようにサンプリングするかは重要ですか?


9

私は無数のビー玉を含むよく混ぜられたバットを持っています。そこビー玉の無限の量がバットであるが、彼らは唯一のいくつかの未知で来るが、有限数の品種kは不明であり、i jの場合、v iタイプの大理石を描く方がv jタイプの大理石を描くよりも可能性が高いかもしれません。

V={v1,v2,v3,...,vk}
kijvivj

実験では、機械が未知の手順を使用してバットをサンプリングします。機械は、設定された報告記述Q k個のサンプルから大理石の品種: X VをXqk

XV;|X|=q

この実験の試験が繰り返される(試験を横切って固定されている)、我々は、サブセットのシーケンスを取得VをX 1X 2... qV(X1,X2,)

私たちが知っている他の唯一のものは:

  • 試験は独立しており、同一です
  • マシンは、そのサンプルで最も頻繁に発生する品種の上位報告しますq

qq

(X1,X2,)


3
+1これはすばらしい質問です。ランダムなサンプリングには、漠然とした形式の恣意性やサンプリング手順に関する知識の欠如以上のものがあることを理解しているからです。
whuber

サンプリング規則は確かに重要です。それ以外の場合は、この手順を考慮してください。機械は、試行ごとに常にタイプ1(最初の種類)の大理石を1つ選択します。各ドローは独立しており、同じように分布します(ささいなことに)。q= 1となり、まったく役に立たない結果になります。
AlaskaRon、2015

回答:


9

メソッドが重要であることを確認する簡単な方法は、ビー玉のタイプに特定の確率を選択し、いくつかの方法に従って各サブセットの確率を計算することです。ただし、これが方法が重要でないことを証明することはできません。

31/21/41/42

{v2,v3}21/41/3=1/6

{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

これらは異なるため、マシンが使用する方法が重要です。タイプが繰り返されるペアを拒否すると、一般的なタイプのペアの重みが小さくなる傾向があります。

q

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.