私は統計学者というよりもプログラマーなので、この質問があまりにも素朴ではないことを願っています。
ランダムにプログラムの実行をサンプリングするときに発生します。プログラムの状態のN = 10のランダムな時間のサンプルを取得すると、たとえば、それらのサンプルのI = 3で関数Fooが実行されていることがわかります。Fooが実行されている時間Fの実際の割合について、それが何を教えてくれるのか興味があります。
私は平均F * Nで二項分布していることを理解しています。IとNが与えられると、Fはベータ分布に従うことも知っています。実際、私はこれらの2つのディストリビューション間の関係をプログラムで検証しました。
cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1
問題は、私が関係について直感的な感覚を持っていないことです。なぜそれが機能するのかを「描く」ことはできません。
編集:すべての答えは、特に@whuberのように挑戦的でした。これはまだ理解する必要がありますが、統計を整理することは非常に役に立ちました。それにもかかわらず、私はもっと基本的な質問をするべきだったことに気付きました:IとNを考えると、Fの分布は何ですか?誰もがベータ版だと指摘しましたが、それは私が知っていました。私はついにウィキペディア(以前の共役)からそれがあるように思えたBeta(I+1, N-I+1)
。プログラムでそれを調べた後、それは正しい答えのように見えます。だから、私が間違っているかどうかを知りたいです。そして、上記の2つのcdfの関係、なぜ合計が1になるのか、そして私が本当に知りたいことと何か関係があるのかどうか、まだ混乱しています。