GLMにはいくつのディストリビューションがありますか?


11

私は、GLMが5つの分布(つまり、ガンマ、ガウス、二項、逆ガウス、およびポアソン)で記述されている教科書の複数の場所を特定しました。これは、Rの家族関数でも例示されています。

追加のディストリビューションが含まれているGLMへの参照に遭遇することがあります()。これらの5つがなぜ特別なのか、または常にGLMにあるのか、誰かがなぜ他の人が特別なのかを誰かが説明できますか?

私がこれまでに学んだことから、指数関数的に家族の中でGLM分布フォームにすべて適合: ここで、ϕは分散パラメーター、θは正準パラメーターです。

f(y;θ,ϕ)=exp{yθb(θ)ϕ+c(y,ϕ)}
ϕθ

GLMに適合するように分布を変換することはできませんか?


5
明らかに、均一分布は指数関数的ファミリーに属していません。
Zhanxiong 2015

いい質問だ。たとえば、対数正規はどうですか?
マイケルM

1
@Zhanxiong、均一なベータ分布の特別なケースではありません、そしてベータ分布は指数ファミリーにありますか?
shf8888

@ shf8888 AFAIKガンマ分布に収束するとき、それは限界の指数系列分布にすぎません。
シャドウトーカー2015

@Zhanxiong、明確化してくれてありがとう!申し訳ありませんが、正解です。境界が不明なので、指数関数的な分布ではありません。
shf8888 2015

回答:


4

あなたが示すように、GLMで分布を使用するための資格は、それが指数ファミリーであるということです(注:これは指数分布と同じではありません!ガンマ分布としての指数分布自体は、指数関数ファミリー)。あなたがリストする5つのディストリビューションは、このファミリーのすべてであり、さらに重要なことに、非常に一般的なディストリビューションであるため、例や説明として使用されています。

Zhanxiongが指摘しているように、(境界が不明な)均一分布は、非指数関数ファミリー分布の典型的な例です。shf8888は、任意の間隔で、Uniform(0、1)と一般的な均一分布を混同しています。Uniform(0,1)分布はベータ分布の特別なケースであり、指数ファミリーです。その他の非指数関数ファミリー分布は、混合モデルとt分布です。

正しい指数ファミリーの定義があり、GLMを使用するために正規パラメーターが非常に重要です。それでも、次のように書くことで、指数関数ファミリーを理解するのが少し簡単になるといつも思っています。

f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]

これを書く一般的な方法があり、スカラー代わりにベクトル使用します。しかし、1次元の場合は多くを説明します。具体的には、次の2つの機能、未知パラメータの一つに要因あなたの密度の非べき乗部分にできなければなりませんではなく、観測データとの1及びません。指数部についても同様です。たとえば、二項分布をこのように書くことができるかを理解するのは難しいかもしれません。しかし、代数的ジャグリングを使用すると、最終的には明らかになります。θθθxxθ

十分な統計量を見つけて仮説をテストするなど、多くのことがはるかに簡単になるため、指数関数ファミリーを使用します。GLMでは、リンク関数を見つけるために正規パラメーターがよく使用されます。最後に、統計学者がほぼすべてのケースで指数関数ファミリーを使用することを好む理由の関連する図は、たとえばとが不明であるUniform(、)分布に対して古典的な統計的推論をいる。それは不可能ではありませんが、指数関数的な家族分布に対して同じことを行うよりもはるかに複雑で複雑です。θ1θ2θ1θ2


両方のパラメーターが不明なベータ分布は、依然として指数ファミリーです(ただし、2パラメーターの指数ファミリー)。どうしてそうではないと思いますか?www2.stat.duke.edu/courses/Spring11/sta114/lec/…またはウィキペディア
DavidR

これを指摘してくれてありがとう、コメントを変更しました...そうです!意味がわからない
ヘンリー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.