連続データにポアソン回帰を使用していますか?


11

ポアソン分布を使用して、連続データと離散データを分析できますか?

応答変数が連続であるいくつかのデータセットがありますが、正規分布ではなくポアソン分布に似ています。ただし、ポアソン分布は離散分布であり、通常は数値またはカウントに関係しています。


では、経験的分布はガンマ変量とどのように異なりますか?
whuber

1
これらのデータにはガンマ分布を使用しました。ログリンクでガンマ分布を使用すると、過剰分散ポアソンモデルから得られるのとほぼ同じ結果が得られますが、ほとんどの統計パッケージでは、ポアソン回帰に精通しているため、ポアソン回帰はより単純ではるかに柔軟です。
user3136 2011

より良い他のディストリビューション、例えばwhuberのガンマの提案はありませんか?
ピーターフロム-モニカの回復

1
@PeterFlom-Rのglmnetパッケージは、ログリンク機能を備えたGammaファミリまたはGaussianファミリのいずれもサポートしていないため、この問題が頻繁に発生するのではないかと思います。ただし、glmnetは予測モデリングパッケージとして使用されるため(したがって、ユーザーはモデル係数のみに関心があり、coeff。stndエラーではない)、Poisson dbnは一貫した係数を生成するためです。形式ln [E(y)] = beta0 + beta * Xのモデルの推定値は、分布に関係なく連続して応答します。glmnetの作成者は、これらの追加のファミリを含めて問題にならなかったと思います。
RobertF 2015年

回答:


12

ここで関連する一般化線形モデルの主要な仮定は、予測子の値が与えられた場合の分散と応答の平均との関係です。ポアソン分布を指定する場合、これは、条件付き分散が条件付き平均に等しいと想定していることを意味します。* 分布の実際の形状はそれほど重要ではありません。または、その平均分散関係が成り立つ限り、他の何か。

*分散が平均と比例の1つに等しいという仮定を緩和しても、通常は良好な結果が得られます。


9

一般化線形モデルでポアソン応答を使用することについて話している場合は、そうです。各観測値の分散がその平均に等しいと仮定してもかまいません。

そうしたくない場合は、別の方法として、応答を変換することもできます(ログを取るなど)。


あなたのポイントに加えて、@ user3136が平均=分散の仮定をする意思がないとしても、彼/彼女はでquasipoisson家族を使用できますglm
suncoolsu

2
しかし、私の問題は、連続データを離散に変換する理由です。本質的に情報を失っています。また、単純なlog変換が機能したとしたら、なぜデータを離散化するのでしょうか。glm作品を使用していますが、すべての結果は漸近
論に

@suncoolsu:1)quasipoissonは分散に比例する平均の仮定を行います。2)別のモデルを使用できるように、離散への変換を意味するのではなく、変換(連続性を維持)を意味しました。
Simon Byrne

ええ-私はあなたに同意することを理解しました。申し訳ありません、私は質問について話していました。準ポアソン、過剰な権利を考慮に入れますか?(私が正しく覚えている場合は、Faraway 2006を参照)
suncoolsu

この特定の例では、私が試みた変換(log、sqrt、box-cox)が正規性を適切に近似することに満足していませんでした。ちなみに、通常のスコア変換方法を使用すると、ほとんどのデータをほぼ美しい正規性に変換できますが、この変換が広く使用されているのを見たことがないので、問題があると思います(逆変換は難しい)。
user3136 2011
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.