Rに適合した負の二項回帰のシータとは何ですか?


26

負の二項回帰に関する質問があります。次のコマンドがあるとします。

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(carsはRで利用可能なデータセットであり、このモデルが理にかなっているかどうかはあまり気にしないことに注意してください。)

私が知りたいのは、どのように変数を解釈できますかtheta(呼び出しの下部に返されますsummary)。これはネガビン分布の形状パラメーターですか?歪度の尺度として解釈することは可能ですか?


MASSが言うことの要約はここにあります
Scortchi -復活モニカ

回答:


17

はい、theta負の二項分布の形状パラメーターです。いいえ、実際に歪度の尺度として解釈することはできません。より正確に:

  • 歪度はの値に依存しますがtheta、平均にも依存します
  • thetaスキューがないことを保証する値はありません

混乱させなかった場合、負の二項回帰で使用されるmu/ thetaパラメータ化では、歪度は

SkewNB=θ+2μθμθ+μ=1+2μθμ1+μθ

これに関連して、は通常、ポアソン分布に関する過分散の尺度として解釈されます。負の二項分布の分散はμ + μθので、 θ本当に(あろうポアソンと比較して過剰変動を制御 μ)、及びスキューはありません。μ+μ2/θθμ


これまでありがとう!これは良い助けです...しかし:シータの高い値または(低い)値をどのように解釈できますか?McCaullaughsの本の一般化線形モデルには、kの解釈を行うためのanscombeからのこの論文へのリンクがあります。しかし、残念ながら、私は本当にそれを理解していません。紙があるclaremontmckenna.edu/facultysites/math/FacMember/MOneill/...
MarkDollar

最初のページを読むだけです。したがって、シータ(またはanscombeのk)はネガビン分布の形状パラメーターであり、分布がガンマ(k-> 0)またはポアソン(k->無限大)に近い場合に管理します。しかし、フィットとはどういう意味ですか?たとえば、車の推定のためにシータを解釈するにはどうすればよいですか?
-MarkDollar

33

Modeling Count Dataコースの学生の一人からこのサイトを紹介されました。負の二項モデルについて、特に分散統計と分散パラメーターに関して、多くの誤った情報があるようです。

カウントモデルの余分な分散を示す分散統計は、ピアソン統計を残留DOFで除算したものです。は位置または形状パラメーターです。カウントモデルの場合、スケールパラメーターは1に設定されます。R およびθμglmglm.nb θは、分散パラメーターまたは補助パラメーターです。私の本の第1版であるNegative Binomial Regression(2007、Cambridge University Press)では不均一性パラメーターと呼びましたが、2011年の第2版では分散パラメーターと呼びます。NBモデル​​のさまざまな用語の完全な理論的根拠は、本日出版予定の私の著書Modeling Count Data(Cambridge)に掲載されています。7月15日までに販売(ペーパーバック)する必要があります。

glm.nbまたglm、分散パラメーターの定義方法に異常があります。分散は、μ+αではなく θμ+μ2θμ+αμ2glm.nbglmglm.nbMcCullagh&Nelderから間接的な関係を引き継いだようですが、Nelder(1972年にGLMの共同創立者)は1993年にkkシステムアドオンをGenstatに書き、直接的な関係が好ましいと主張しました。彼と彼の妻は、1993年初めから彼が亡くなる前年までアリゾナ州で隔年で私と私の家族を訪問していました。1992年後半にStataとXploreソフトウェア用に、そして1994年にSASマクロ用に作成したglmプログラムに直接関係を置いていたので、これについてかなり徹底的に議論しました。

nbinomialαθnbinomial


2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ「形状」-後者は確かに形状に影響を与えるため、不合理とは思いません。
モモ14年

シータの範囲は?シータは1より大きい値である必要がありますか?
News_is_Selection_Bias

2

glm参照負の二項: ここに画像の説明を入力してください

ウィキペディアの負の二項「r」はglmの「theta」であり、これはglm「theta」が形状パラメーターであることを意味します。簡単に言えば、glmの「シータ」は失敗の数です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.