ゼロ膨張ポアソン回帰モデルは、サンプルに対してによって
定義され
そしてさらに、パラメーターおよび満たすと仮定しますYは、iが = { 0の確率でのp I + (1 - P I)E - λ I kの確率で(1 - P I)E - λ I、λはk個のI / Kを!λ = (λ 1、... 、λ N)P =(y1,…,yn)
Yi={0kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!
λ=(λ1,…,λn)p=(p1,…,pn)
ログ(λ)ロジット(p)= B β= ログ(P /(1 - P))= G γ。
ゼロインフレーションポアソン回帰モデルの対応する対数尤度は、
L (γ、β; y)= ∑y私= 0ログ(eG私γ+ exp(− eB私β))+ ∑y私> 0(y私B私β− eB私β)− ∑i = 1んログ(1 + eG私γ)− ∑y私> 0ログ(y私!)
ここで、とは計画行列です。これらの行列は、2つの生成プロセスで使用したい機能に応じて、同じにすることができます。ただし、行数は同じです。GBG
が完全なゼロ状態からのものである場合に観測でき、がポアソン状態からのものである場合に観測できると仮定すると、対数尤度は次のようになります。Y i Z i = 0 Y iZ私= 1Y私Z私= 0Y私
L (γ、β; y、z)= ∑i = 1んログ(f(z私| γ))+ ∑i = 1んログ(f(y私| z私、β))
=∑i=1nzi(Giγ−log(1+eGiγ))+−∑i=1n(1−zi)log(1+eGiγ)+∑i=1n(1−zi)[yiBiβ−eBiβ−log(yi!)]
最初の2つの項は、を分離するロジスティック回帰の損失です
z_i = 1から。2番目の項は、ポアソンプロセスによって生成されたポイントへの回帰です。
zi=0zi=1
しかし、潜在変数は観察できませんか?目的は、最初の対数尤度を最大化することです。しかし、潜在変数を導入し、新しい対数尤度を導出する必要があります。次に、EMアルゴリズムを使用して、2番目の対数尤度を最大化できます。しかし、これは、またはいずれかであることがわかっていると想定していますか?Zi=0Zi=1