セットAとサブセットBがあるとします。| A |がわかっている場合は、| B |を計算できます。Aからランダムに一様に選択された要素がBに属する確率pを見つけることによって。具体的には、| A | p = | B |です。
Aのn個の要素をランダムに均一に生成し、このデータを使用してp(Bの要素数をnで割った値)を推定し、| B |を推定するとします。
この見積もりはどの程度信頼できますか?つまり、エラーをどのように計算できますか?
余談ですが、この手法に名前はありますか?(それはマークアンドリキャプチャー技術の数学的なバージョンのようです)
1
それは二項推定です。(マーキングや再キャプチャはまったく行われません。超幾何推定につながります。)
—
whuber