ゼロ膨張分布、それらは本当に何ですか?


15

膨らんだゼロ分布を理解するのに苦労しています。彼らは何ですか?ポイントは何ですか?

多くのゼロを持つデータがある場合、ロジスティック回帰を当てはめてゼロの確率を最初に計算し、次にすべてのゼロを削除してから、分布の選択(ポアソンなど)を使用して通常の回帰を当てはめることができます。

それから誰かが私に「ねえ、ゼロ膨らんだ分布を使う」と言ったが、それを調べてみれば、上で提案したことと何も違うことはないようだ?正規のパラメーターがあり、ゼロの確率をモデル化する別のパラメーターpがありますか?それは両方のことを同時にしないだけですか?μp


3
なぜすべてのゼロを削除するのですか?一緒に行うことができます。最初に0と1の確率を計算し、それをゼロ膨張モデル(分布)であるポアソン分布への重みとして使用します。これを読んで、それは非常に明確ですen.wikipedia.org/wiki/Zero-inflated_model
ディープノース

回答:


13

ロジスティック回帰の適合は、最初にゼロの確率を計算し、次にすべてのゼロを削除し、分布の選択(ポアソンなど)を使用して通常の回帰を適合させます。

あなたは絶対に正しい。これは、ゼロ膨張モデルに適合する1つの方法です(またはAchim Zeileisがコメントで指摘しているように、これは厳密にゼロ膨張モデルの特殊なケースと見なすことができる「ハードルモデル」です)。

説明した手順と「オールインワン」ゼロ膨張モデルの違いは、エラーの伝播です。統計の他のすべての2ステップ手順と同様に、ステップ2での予測の全体的な不確実性は、予測が0であるかどうかに関する不確実性を考慮しません。

時にはこれは必要な悪です。幸いなことに、この場合は必要ありません。Rでは、pscl::hurdle()またはを使用できますfitdistrplus::fitdist()


「ステップ2での予測の全体的な不確実性は、予測を0にするべきかどうかに関する不確実性を考慮に入れません」と説明できますか?あなたはジップポアソンを行うと、あなたはそのためポアソンモデルの尤度関数に複数の第1の部分の確率を、ステップ2には、アカウントに0または1の不確実性を取るだろう
ディープ・ノース

1
PY=1|バツ=バツ=0.510.51

3
@ssdecontrol通常、これはゼロ膨張モデルではなく、ハードルモデル(例:)と呼ばれますpscl::hurdle()。そして、適切な適合を得るために、ゼロなしのデータに使用される分布はゼロで切り捨てられます(または、そもそもゼロにならないようにします)。詳細については、返信を参照してください。
アヒムザイレイス

9

説明する基本的な考え方は有効なアプローチであり、ゼロ膨張モデルではなく、ハードルモデル(または2部モデル)と呼ばれることがよくあります

ただし、非ゼロデータのモデルでは、ゼロを削除することが重要です。ポアソンモデルをゼロなしのデータに近似すると、ポアソン分布は常にゼロの正の確率をもつため、これはほぼ確実に適合度が低くなります。自然な代替方法は、ゼロ切り捨てポアソン分布を使用することです。これは、カウントデータの回帰を妨げる古典的なアプローチです。

ゼロ膨張モデルとハードルモデルの主な違いは、回帰のバイナリ部分でモデル化される確率です。ハードルモデルの場合、それは単にゼロ対ゼロ以外の確率です。ゼロ膨張モデルでは、過剰ゼロを持つ確率、つまり、非膨張分布によって引き起こされないゼロの確率(ポアソンなど)です。

Rのカウントデータのハードルモデルとゼロインフレモデルの両方の説明については、JSSで公開され、psclパッケージへのビネットとして出荷された原稿を参照してください:http : //dx.doi.org/10.18637/jss.v027.i08


7

ssdecontrolが言ったことは非常に正しい。しかし、私は議論に数セントを追加したいと思います。

YouTubeでRichard McElreathによるカウントデータのZero Inflatedモデルに関する講義を見ました。

特に、観測されたゼロがポアソン分布から生じる可能性が100%ではないことを考慮する場合、純粋なポアソンモデルのレートを説明している変数を制御しながらpを推定することは理にかなっています。

マルチレベルモデルとしてのゼロ膨張分布

また、モデルのパラメーターを考慮する場合にも意味があります。推定する2つの変数、pとポアソンモデルのレート、および2つの方程式、カウントがゼロの場合とカウントが異なる場合ゼロ。

画像ソース:統計的再考-リチャードマッケルレスによるRとスタンの例を含むベイジアンコース

編集:タイプミス


学習資料への参照は大歓迎です...しかし、これは手元の質問にどのように答えますか?これは回答として投稿されたコメントのように見えます
...-RTbecard
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.