準二項分布とは何ですか(GLMのコンテキストで)?


30

準二項分布とは何か、それが何をするのか、直感的な概要を誰かが提供できることを望んでいます。私は特にこれらの点に興味があります:

  1. 準二項分布が二項分布とどのように異なるか。

  2. 応答変数がプロポーションの場合(例の値には0.23、0.11、0.78、0.98が含まれます)、準二項モデルはRで実行されますが、二項モデルは実行されません。

  3. TRUE / FALSE応答変数が過度に分散しているときに準二項モデルを使用する理由。

回答:


20
  1. 二項分布と準二項分布の違いは、これらの分布を特徴付ける確率密度関数(pdf)で見ることができます。

    二項PDF:

    P(X=k)=(nk)pk(1p)nk

    準二項PDF:

    P(X=k)=(nk)p(p+kϕ)k1(1pkϕ)nk

    準二項分布は、二項分布に似ていますが、追加のパラメーター(制限されます)二項分布だけでは説明できないデータの追加の分散。| ϕ | { P / N 1 - P / N }ϕ|ϕ|min{p/n,(1p)/n}

    (準二項分布の平均は自体ではなくであることに注意してください。)pi=0nn!ϕi(nk)!p

  2. これについてはわかりませんが、おそらくRのglm関数は、これを説明するために準二項モードで重みを追加しますか?

  3. 追加パラメーターの目的は、データの追加分散を推定することです。すべての一般化線形モデル(GLM)は、結果/応答の分布を仮定し、この分布に基づいてデータの尤度を最大化します。これはアナリストが行う選択であり、データの変動をさらに考慮する必要がある場合は、準二項分布を選択して、GLMの応答をモデル化できます。二項式の代わりに準二項モデルを近似する必要があるかどうかをテストするための優れた方法は、準二項モデルを近似し、パラメータが0 かどうかをテストすることです。ϕϕ


2
優れたアレハンドロ、今、howパラメータが0であるかどうかをテストできますか?
-Juanchi

2
Rwith glm.fitbinomialand quasibinomialはまったく同じであることに注意してください。ただし、quasibinomial(1)整数チェックを削除し、(2)NAのAICを返します。詳細については、この回答を参照してください。
ミゲルモリン

-1この種の「準二項」分布は、glmsのコンテキストでの準二項尤度とはまったく関係がないようであるため、なぜこれほど多くの賛成票を得たのかはわかりにくいです。
ジャールタフト

14

準二項分布は必ずしも特定の分布ではありません。これは、一般化線形モデルの分散と平均の関係のモデルを記述します。これは、二項平均の観点から二項の分散を倍したものです。ϕ

そのような仕様に適合する分布(明らかなもの-スケーリングされた二項分布)がありますが、準二項モデルが適合される場合、それは必ずしも目的ではありません。まだ0〜1のデータに適合する場合、2項式でスケーリングすることはできません。

ϕ

応答変数が割合である場合(例の値には0.23、0.11、078、0.98が含まれます)、準二項モデルはRで実行されますが、二項モデルは実行されません

私の記憶では、二項モデルはプロポーション*でRで実行できますが、正しく設定する必要があります。

*私が知っているRに二項データを与える3つの別々の方法があります。私はそれが確かだと確信しています。


これは準尤度推定とどのように関係していますか?
tim.farkas

2
+1(しかし、より包括的な答えが欲しい!)比率で二項GLMを設定する3つの方法は、おそらく次のとおりです。stats.stackexchange.com / a / 26779 / 28666?リンクが役立つ場合があります。また、「準二項」が実際に分布ではないことについてあなたが言ったことは、このスレッドの2番目の答えにどのように関係していますか?
アメーバは、モニカを復活させる

1
@amoebaは、私の答え(スケーリングされた二項式)に記載されているように、分布を書くことができますが、それはカウントデータ(分散パラメータが1でない限り、すべての整数にあるわけではありません)または連続データ(離散的です!)。人々は通常、その分散構造のためにカウントデータにそれを使用します(ただし、この場合、指数関数ファミリにはそのような分布はありません)
Glen_b -Reinstate Monica
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.