カウントデータの分散のパラメトリックモデリング


12

いくつかのデータをモデル化することを検討していますが、使用できるモデルのタイプがわかりません。カウントデータがあり、データの平均と分散の両方のパラメトリック推定値を提供するモデルが必要です。つまり、さまざまな予測因子があり、それらのいずれかが(グループ平均だけでなく)分散に影響するかどうかを判断したいのです。

分散が平均に等しいため、ポアソン回帰が機能しないことを知っています。私の場合、この仮定は有効ではないので、過剰分散があることを知っています。ただし、負の二項モデルは単一の過分散パラメーターのみを生成し、モデル内の予測変数の関数ではありません。どのモデルがこれを行うことができますか?

さらに、モデルおよび/またはモデルを実装するRパッケージについて説明している書籍または論文への参照を歓迎します。


1
最初にポアソン回帰を行わずに過分散があることをどのように確認しますか?結局のところ、生の(応答)値の分散をそれらの平均と比較することは関係ありません:重要なのは、ポアソンモデルの適合度です(これは、評価と比較した線形モデルでの残差の分布の評価の類似体です)応答変数の分布)。別の言い方をすれば、独立変数と応答の間のリンクにより、美しく正確なポアソンモデルであっても、過分散の外観が作成される可能性があります。
whuber

2
@whuberそれは公正な点です。サブグループの分散と平均を調べる単一のカテゴリカル予測子では、過分散を検出するのに十分ですが、多変量ポアソン回帰ではそうではありません。議論のために、ポアソンと負の二項回帰の両方が行われ、負の二項分布がanovaモデル比較を介してより良い適合を示すと仮定しましょう。それは過剰分散を示しているはずです。それを考えると、分散/過分散は定数としてではなくパラメトリックにモデル化できますか?
ブライアンディグス

1
McCullagh and Nelderの一般化線形モデル、第2版に、これをカバーする章があると思います(ただし、私のコピーは仕事中です)...本当の可能性はありませんが、準尤度を使用できます。章のタイトルかもしれません。対応する確率モデルがない場合でも、反復的に再重み付けされた最小二乗を適用します。
カール

McCullagh and Nelderの第10章では、平均と分散の共同モデリング、つまり平均と分散の両方のパラメーター化について説明しています。拡張準尤度が主なツールですが、状況によってはその方法に懸念
ゲスト

回答:


9

Rのgamlssパッケージを使用して、負の二項分散パラメーター自体を変数およびパラメーターの関数としてモデル化できます。導入部からの抜粋を提供します。

GAMLSSを使用する理由

応答変数がカウント(離散)データである場合、ポアソン分布が適切に適合しない可能性が非常に高くなります。GAMLSSは、試用できるさまざまな離散分布(負の二項分布を含む)を提供します。分散パラメーターは、説明変数の関数としてモデル化することもできます。

www.gamlss.orgのWebサイトには、パッケージで使用されるアプローチに関するドキュメントといくつかの論文へのリンクがあります。


どちらの返信も役に立ち、参考になります。(a)それが4分前に先行したこと、および(b)gamlssソリューションが私にとって新しい(私はnbregに精通している)ので、私はこれに賞金を授与しています。しかし、良い返信を提供してくれた@timbpに嫌気がさします。あなたが私たちのサイトに貢献し続けることを願っています。
whuber

2
@whuber、どちらが非常に有用だったので、私はどちらが「答え」として受け入れるべきかについても引き裂かれました。私が使用できるRパッケージ参照が含まれていたので、私はこれを使いました。他の答えの本の参照は良い読書であり、割引されるべきではありません。これら2つの良い答えを促した賞金を提供してくれてありがとう。
ブライアンディグス

9

Stataには-gnbreg-コマンドが用意されており、分散パラメーターをモデル化できます。http://www.stata.com/help.cgi?nbregでコマンドのStataヘルプを表示できます

Stataはこれを一般化された負の二項モデルと呼びます。ジョセフ・ヒルベは、彼の著書「負の二項回帰」のセクション10.4で、「NB-H:異種の負の二項回帰」として議論しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.