次のカウントデータのヒストグラムがあります。そして、離散分布をそれに当てはめたいと思います。これについてどうすればいいかわかりません。
最初に離散分布、たとえば負の二項分布をヒストグラムに重ね合わせて、離散分布のパラメーターを取得し、Kolmogorov–Smirnov検定を実行してp値を確認する必要がありますか?
この方法が正しいかどうかはわかりません。
このような問題に取り組む一般的な方法はありますか?
これは、カウントデータの度数分布表です。私の問題では、ゼロ以外のカウントのみに焦点を合わせています。
Counts: 1 2 3 4 5 6 7 9 10
Frequency: 3875 2454 921 192 37 11 1 1 2
更新:質問したい:Rのfitdistr関数を使用して、データを近似するためのパラメーターを取得しました。
fitdistr(abc[abc != 0], "Poisson")
lambda
1.68147852
(0.01497921)
次に、ヒストグラムの上にポアソン分布の確率質量関数をプロットします。
ただし、ポアソン分布はカウントデータのモデル化に失敗したようです。何か私にできることはありますか?
?MASS::fitdistr
既にR分布にあるので、ここから始めます(最後の例を参照してください。負の二項のパラメーター化の詳細については、rnegbinを参照してください)。....「そしてMLを見つけたら、次に何をすべきか?」-その時点で、パラメーターの推定値と標準誤差があります。それを超えて、何を達成したいですか?-推測できません。