回答:
二項分布と準二項分布の違いは、これらの分布を特徴付ける確率密度関数(pdf)で見ることができます。
二項PDF:
準二項PDF:
準二項分布は、二項分布に似ていますが、追加のパラメーター(制限されます)二項分布だけでは説明できないデータの追加の分散。| ϕ | ≤ 分{ P / N 、(1 - P )/ N }
(準二項分布の平均は自体ではなくであることに注意してください。)
これについてはわかりませんが、おそらくRのglm関数は、これを説明するために準二項モードで重みを追加しますか?
追加パラメーターの目的は、データの追加分散を推定することです。すべての一般化線形モデル(GLM)は、結果/応答の分布を仮定し、この分布に基づいてデータの尤度を最大化します。これはアナリストが行う選択であり、データの変動をさらに考慮する必要がある場合は、準二項分布を選択して、GLMの応答をモデル化できます。二項式の代わりに準二項モデルを近似する必要があるかどうかをテストするための優れた方法は、準二項モデルを近似し、パラメータが0 かどうかをテストすることです。
準二項分布は必ずしも特定の分布ではありません。これは、一般化線形モデルの分散と平均の関係のモデルを記述します。これは、二項平均の観点から二項の分散を倍したものです。
そのような仕様に適合する分布(明らかなもの-スケーリングされた二項分布)がありますが、準二項モデルが適合される場合、それは必ずしも目的ではありません。まだ0〜1のデータに適合する場合、2項式でスケーリングすることはできません。
応答変数が割合である場合(例の値には0.23、0.11、078、0.98が含まれます)、準二項モデルはRで実行されますが、二項モデルは実行されません
私の記憶では、二項モデルはプロポーション*でRで実行できますが、正しく設定する必要があります。
*私が知っているRに二項データを与える3つの別々の方法があります。私はそれが確かだと確信しています。