状況が完全にわからなくても答えてみます。数式を調整する必要があります!二項分布におけるの推定の問題は古く、関連する論文が複数あります。最後にいくつか参考資料を紹介します。 N
そことする(OPの例における領域を有する)、各領域からの(同じ長さの互いに素な時間間隔からの)サンプル。観測された変数はこれは独立した二項確率変数で、それぞれ分布どちらも不明です。対数尤度関数は
通常の問題では、が既知であり、だけが不明である場合、二項式の合計(または平均)はカウントすることに注意してくださいRR=2TxitBin(Ni,p)ℓ(Ni,p)=∑ln(Nixit)+lnp⋅∑xit+ln(1−p)⋅∑(Ni−xit)
Nipxitは十分な要約なので、合計の二項分布の観点から分析を行うことができます。しかし、私たちの問題では、対数尤度関数の最初の項のためにそうではなく、対数尤度はそれぞれのカウントに個別に依存します!だからあなたが提案することは、(超えて)数の合計に減らすために、情報を失うことになるので行わないでください(どれくらいか、私にはわかりませんが、調査することができます...)。これをもう少しよく理解してみましょう。まず、が一貫した推定量であることを以下に示しますimaxt(xit)Ni、しかし、この一貫した推定量は合計されたカウントの関数ではありません。これは、合計によって情報が失われることを示す1つの明確な兆候です。また、平均はである期待値の不偏推定量ですが、他のパラメーターについて何も知られていない場合、とに関する情報を個別に保持していないようです。これは、尤度関数にに関する有用な情報がある場合、値の広がりに含まれている必要があることを示していますNipNipNixi1…,xiT、合計が悪いことを示します。以下で参照するOlkinらの論文は、多くの場合、モーメント法推定量が最大尤度よりも優れていることを実際に示しています。の経験的分散を使用するため、合計データから計算できませんでした。xi1…,xiT
この問題は不安定であることがわかっています。その理由を理解してみましょう。通常の問題では、が既知の場合に推定しますが、推定は、データの全体的な特徴である平均から行うことができます。と両方を推定しようとするときは、対数尤度関数のはるかに細かいプロパティ(したがってデータ)を使用します。理由を確認するために、がゼロになり、が一定の正の積で境界なしに大きくなると、ポアソン分布を二項式の限界として取得できることを思い出してください。したがって、が小さく、pNiNippNpN大きい場合、二項分布はその制限に非常に近くなります。(A)、(B) 2つの場合をます。2つの(二項)分布のヒストグラムを描画します。N=100,p=0.01N=20,p=0.05
> zapsmall(cbind(0:20,pA,pB))
pA pB
[1,] 0 0.366032 0.358486
[2,] 1 0.369730 0.377354
[3,] 2 0.184865 0.188677
[4,] 3 0.060999 0.059582
[5,] 4 0.014942 0.013328
[6,] 5 0.002898 0.002245
[7,] 6 0.000463 0.000295
[8,] 7 0.000063 0.000031
[9,] 8 0.000007 0.000003
[10,] 9 0.000001 0.000000
[11,] 10 0.000000 0.000000
[12,] 11 0.000000 0.000000
[13,] 12 0.000000 0.000000
[14,] 13 0.000000 0.000000
[15,] 14 0.000000 0.000000
[16,] 15 0.000000 0.000000
[17,] 16 0.000000 0.000000
[18,] 17 0.000000 0.000000
[19,] 18 0.000000 0.000000
[20,] 19 0.000000 0.000000
[21,] 20 0.000000 0.000000
この確率の表の上。観測されたデータから、この2つの分布のどちらを持っているかを検出することは、この場合、かかを決定するために必要なことです。それは明らかにかなり困難であり、結果として得られる推定量の不安定性は予想されるだけです。この例は、不安定性が主に小さいことも示しています。が0.7前後になると予想しているため、問題はより安定している可能性があります。既知の関数として最尤推定量を見つけ、それをに対してプロットすることにより、データについてそれを調査できます。N=100N=20ppppある信頼区間で。または、完全なベイズを使用することもできます。これは、かなり曖昧な事前情報でも役立つ場合があるケースです。
パラメータは確かに推定可能です。それがあることは明らかであるが推定器のように、その最大数を使用することが可能であるので、。その推定量は強い整合性があり、整合性のある推定量を持つパラメーターは推定可能でなければなりません。しかし、上記の例が示すように、推定可能性はほぼ形式的です。実際には、が非常に異なる分布は非常に近いため、は非常に弱く推定できます。Ni≥maxt(xit)NNN
ここでは推定方法の詳細は示しませんが、確認できる参照をいくつか示します。
Ingram Olkin、A John Petkau、James V Zidek:二項分布のN推定量の比較。JASA1981。これは、MLとモーメント推定量、およびいくつかのより安定したバリアントを開発および分析する古典的な論文です。また、興味深いことに、多くの場合、モーメント法推定器はML推定器よりも優れています。
レイモンドJキャロルとFロンバード:二項分布のN推定量に関するメモ。JASA1985。尤度から
を統合することに基づいて、代替の、より安定した、おそらくより優れた推定器を開発します。また、合計されたカウントが不十分であることにも注意してください。p
Jアンドリューロイル:空間的に複製されたカウントから人口サイズを推定するためのN_Mixtureモデル。バイオメトリクス、2004。これは、別の代替ベイジアンアプローチを提供するものです。
具体的な質問に戻りましょう。2つのリージョンの数を合計するべきではありません!それは情報を失うでしょう。を導入すると、対数尤度関数は、および(または)の関数として記述できます。次に、余分なパラメータをいくつかの手順で削除する必要があります。私はそれに戻りますが、時間はありません! N=N1+N2NpN1N2N1