ゼロ膨張ポアソン回帰


14

仮定独立しており、Y=Y1Yn

Yi=0with probability pi+(1pi)eλiYi=kwith probability (1pi)eλiλik/k!

また、パラメーターおよび\ textbf {p} =(p_1、\ dots、p_n)が満たされると仮定します。λ=(λ1,,λn)p=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gλ.

同じ共変量がλおよびp影響してB=Gになる場合、ゼロポアソン回帰はなぜポアソン回帰の2倍のパラメーターを必要としますか?


2
まだβ\ lambdaを推定する必要がありλます。BおよびGは設計行列(データ)であるため、これらが等しい場合でもパラメーター空間の次元は減少しません。
マクロ

@Macro:Gが1の列である場合、ポアソン回帰よりも1つのパラメーターを推定する必要があるのはなぜですか?
ダミアン

よくあなたは推定する必要があると思いpi(モデルのロジスティック一部で「インターセプト」)とλi(モデルのポアソン一部で「インターセプト」)をその代わりに、1の2つのパラメータがあります
マクロ

1
@Robby、パラメーターの数を減らすには、いくつかの制約を作成する必要があります。たとえば、λ=β、これが理にかなっていると考える理由はありません-特にリンク関数が異なるためです。
マクロ

3
@MichaelChernick-ポアソンと同じ相対確率を維持しながら、ポアソン分布からゼロを見る確率を基本的に「膨張」させるため、ゼロ膨張ポアソンと呼ばれます。
jbowman

回答:


2

ゼロ膨張ポアソンの場合、場合、と両方とも同じ長さであり、これはまたはの列数です。したがって、パラメーターの数は、設計行列の列数の2倍、つまり、切片(および必要なダミーコーディング)を含む説明変数の数の2倍になります。B=GβλBG

まっすぐなポアソン回帰では、心配するベクトルはなく、を推定する必要はありません。そのため、パラメーターの数は、の長さ、つまりゼロ膨張した場合のパラメーターの数の半分になります。pλβ

現在、がと等しくなければならない特別な理由はありませんが、一般的には理にかなっています。ただし、1つのプロセスによってイベントが発生する可能性がまったくあり、まったく異なるプロセスがイベントの数を決定するデータ生成プロセスを想像できます。ゼロ以外のイベント。不自然な例として、私は歴史試験の得点に基づいて教室を選び、無関係なゲームをプレイし、得点の数を観察します。この場合、 はとかなり異なる場合があり(履歴試験のスコアを左右するものがゲームのパフォーマンスを左右するものと異なる場合)。BGGλBβBGβと長さは異なる場合があります。は以下の列がある場合があります。したがって、その場合のゼロ膨張ポアソンモデルには、単純なポアソンモデルよりも多くのパラメーターがあります。λGB

一般的に、ほとんどの場合、と思います。G=B

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.