発生のランダムサンプリングに基づいてイベントの頻度を推定できますか?


9

いくつかの編集が行われました...

この質問はただの面白さなので、面白くない場合は無視してください。私はすでにこのサイトから多くの助けを得ているので、私を養う手を噛みたくありません。これは実際の例に基づいており、私がよく疑問に思ったものです。

私は地元の道場を訪れ、月曜日から金曜日まで基本的にランダムにトレーニングをしています。週に2回訪問するとします。これは、私が毎週正確に2回訪問することを意味します。私がいるときはいつでも、ほとんどいつもそこにいる一人の人がいます。彼が私と同じ日に訪問した場合、私は彼に会います。私がいるときの90%の時間に彼がいるとしましょう。2つのことを知りたい:

1)彼が訓練する頻度

2)彼がランダムに来るか、週の特定の日に来るか。

おそらく、もう1つを推測するために1つを想定する必要があると思いますか?私は本当にこれで全くどこにも行きません。毎週のウォームアップでそれについて考えているだけで、新たに困惑します。誰かが私に問題について考える方法を与えたとしても、私は最も感謝します。

乾杯!


1
@Chrisさん、モデルの定義から始める必要があります。ランダムに週に2回訪問すると言うと、多くのことを意味する可能性があります。たとえば、セットの2つの要素のランダムな組み合わせとして選択して、毎週正確に 2回行くか、平均 2回行くことができます。たとえば、バイアスのかかったコインを2/5の表の確率で反転させ、毎日頭に出会う週です。これらは唯一のオプションではありません。{Mon,,Fri}
枢機卿

また、彼と同じ日に道場に行くと、いつも彼に会えると思いますか?そうでない場合は、道場が開いている毎日の時間と比較して、セッションの長さとセッションの長さについて何かを知る必要があると思います。
ワンストップ2011年

1
@ Chris、@ onestop、この質問は私に思い出させ、関連するものです。多くの場合、肯定的に回答するという社会的な不名誉のために、質問に正直に答えるのを嫌がる可能性のある人々をサンプリングするために使用されます。サンプリングにランダムな要素を導入して、かなり高い確率で、回答者が実際に否定的に応答したとしても、肯定的に応答する(より恥ずかしい答え)ようにします。ランダムに決定された「はい」の確率が十分に高い場合、「恥ずかしさの偏り」は減少します。もちろん、より多くの人をサンプリングする必要もあります。
枢機卿

1
@クリスあなたはいくつかのより多くの仮定をする必要があります。現在、有効な説明が多数あります。これはばかげた話です:個人の訪問はあなたの訪問とは無関係ですか?そうでない場合、おそらく彼はあなたが訪問したときだけ(彼は毎日あなたの車を外で探します)訪問しますが、中に入るかどうかを決定する前にコインを投げます(確率0.9)。
vqv 2011年

1
簡単な解決策:彼に聞いてください:-)。
whuber

回答:


5

データは、Hansen-HurwitzまたはHorvitz-Thompson推定量を使用して部分的な回答を提供します。

モデルはこれです。この個人の出席を一連のインジケーター(0/1)変数、として表します。毎週のブロックから2要素のサブセットをランダムに観察します。(これは体系的なサンプリングの形式です。)iは= 1 2 ... Q 5 K + 1Q 5 、K + 2... Q 5 K + 5(qi)i=1,2,(q5k+1,q5k+2,,q5k+5)

  1. 彼はどのくらいの頻度で訓練しますか?週平均を推定したいとします。収集した統計から、平均観測値は0.9であることがわかります。これが週間にわたって収集されたとしましょう。その場合、個人の総訪問数のHorvitz-Thompson推定量は = = =(ここで、はを観測する機会であり、合計は実際の観測値を上回っています。)つまり、彼は週に4.5日トレーニングすると推定する必要があります。 w q iqiw 5qiπi552qi4.5wのπIのQI52(2w)0.94.5wπiqi この推定の標準誤差を計算する方法については、リファレンスを参照してください。非常に優れた近似として、通常の(二項)式を使用できます。

  2. 彼はランダムに訓練しますか?伝える方法はありません。曜日ごとに合計を維持する必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.