ガンマ分布と正規分布の関係


26

最近、平均が0の正規確率変数の2乗のpdfを導出する必要があることがわかりました。何らかの理由で、事前に分散を正規化しないことを選択しました。これを正しく行った場合、このpdfは次のようになります。

N2(x;σ2)=1σ2πxex2σ2

これは、実際にはガンマ分布のパラメータ化にすぎないことに気付きました。

N2(x;σ2)=Gamma(x;12,2σ2)

そして、2つのガンマ(同じスケールパラメーター)の合計が別のガンマに等しいという事実から、そのガンマは 2乗正規確率変数の合計に等しいということになります。k

NΣ2(x;k,σ2)=Gamma(x;k2,2σ2)

これは私には少し驚きでした。私が知っていたにもかかわらず乗の和の分布-分布の標準的な通常のRV車を-私は、ガンマは基本的に通常の合計を可能にだけ一般化したことに気づかなかった、ガンマの特殊なケースでした任意の分散のランダム変数。これは、指数分布が2つの正規分布の2乗の和に等しいなど、これまでに出会ったことのない他の特性化にもつながります。χ2

これはすべて私にとってやや不思議です。上記で説明したように、正規分布はガンマ分布の導出の基本ですか?私がチェックしたほとんどのリソースは、2つの分布が本質的にこのように関連していること、またはその点についてもガンマの導出方法を説明していません。これにより、複雑な方法で単純に強調した下位レベルの真実がいくつかあると思いますか?


6
確率論に関する多くの学部の教科書は、上記のすべての結果に言及しています。しかし、おそらく統計テキストはこれらのアイデアをカバーしていませんか?いずれの場合においても、確率変数Y iを単にさσ X Iここで、X iは、標準正規確率変数であるので(IID変数に対する)Σ I Y 2 I = σ 2 Σ I X 2 私は単にスケーリングされたχ 2N(0,σ2)YiσXiXiiYi2=σ2iXi2 χ2確率論は、確率論を研究した人にとって驚くべきことではありません。
ディリップサルベート

私はコンピュータビジョンのバックグラウンドから来ているので、通常確率論に出くわすことはありません。私の教科書(またはウィキペディア)のいずれもこの解釈に言及していません。私はまた、2つの正規分布の平方和について特別なことを求めていると思うので、待機時間の良いモデルになります(すなわち、指数分布)。もっと深いものが足りないように感じます。
timxyz

3
ウィキペディアカイ二乗分布をen.wikipedia.org/wiki/Chi-squared_distribution#Definitionの二乗法の合計として定義し、カイ二乗はガンマの特別なケースであると述べているため(en.wikipedia.org/wikiで) / Gamma_distribution#Others)、これらの関係があまり知られていないと主張することはほとんどできません。分散自体は、すべての場合に測定単位(スケールパラメーター)を確立するだけであるため、追加の複雑さはまったく導入されません。
whuber

3
これらの結果は確率と統計の分野ではよく知られていますが、独自の分析でそれらを再発見するために@timxyzによく行われます。
モニカの復活

接続は神秘的ではありません。それは、それらが分布の指数関数族のメンバーであるためです。その顕著な特性は、変数および/またはパラメーターの置換によって到達できることです。以下の例の回答を参照してください。
カール

回答:


18

サルワテ教授のコメントが指摘したように、二乗正規分布とカイ二乗の関係は非常に広く普及している事実です-カイ二乗はガンマ分布の特殊なケースにすぎないという事実もあるはずです:

XN(0,σ2)X2/σ2χ12X2σ2χ12=Gamma(12,2σ2)

ガンマのスケーリングプロパティに続く最後の等式。

指数関数との関係に関しては、正確には、他のの分散でスケーリングされた 2つのゼロ平均法線の合計であり、指数分布になります。

X1N(0,σ12),X2N(0,σ22)X12σ12+X22σ22χ22σ22X12+σ12X22σ12σ22χ22

σ22X12+σ12X22σ12σ22χ22=Gamma(1,2σ12σ22)=Exp(12σ12σ22)

しかし、2つの2 ゼロの合計に「何か特別な」または「より深い」があるという疑いは、「それらを待機時間の良いモデルにする」正規平均を意味します:まず、指数分布について特別なことは何ですかそれは「待ち時間」のための良いモデル?もちろん無記憶ですが、ここには何か「より深い」ものがありますか、それとも指数分布関数の単純な関数型との特性ですか?ユニークなプロパティは数学のあちこちに散らばっており、ほとんどの場合、「より深い直観」や「構造」を反映していません-ただ存在します(ありがたいことに)。e

第二に、変数の二乗はそのレベルとはほとんど関係がありません。ただ、考える、たとえば、中に[ - 2 f(x)=x[2,2]

ここに画像の説明を入力してください

...または標準平方密度をカイ2乗密度に対してグラフ化します。2番目は1番目の平方である変数の密度であるため、それらは非常に密接に関連しているにもかかわらず、まったく異なる確率的挙動を反映して表します。法線は、確率的挙動をモデル化するために開発した数学的システムの非常に重要な柱かもしれません-しかし、ひとたびそれを二乗すると、それはまったく別のものになります。


特に私の最後の段落の質問に答えてくれてありがとう。
timxyz 14年

2
どういたしまして。質問が投稿されてから26か月後に元のOPに回答が届いたことをうれしく思います。
アレコスパパドプロ14

11

提起された質問に対処しましょう。これはすべて私にとってやや不可解です。正規分布はガンマ分布の導出の基本ですか?謎ではありません。単に、正規分布とガンマ分布が指数分布のメンバーであることが単純です。このファミリーは、パラメーターや変数の置換によって等式形式を変換する能力によって定義されます。結果として、分布間の置換による変換が多くありますが、そのうちのいくつかを下の図に要約します。

ここに画像の説明を入力してくださいLEEMIS、ローレンスM。ジャクリンT. MCQUESTON(2008年2月)。「単変量分布関係」(PDF)。アメリカの統計学者。62(1):45–53。doi:10.1198 / 000313008x270448 引用

以下に、2つの正規分布とガンマ分布の関係を詳細に示します(カイ2乗やベータ経由など、不明な数のその他の関係)。

最初に、ガンマ分布(GD)と平均ゼロの正規分布(ND)の間のより直接的な関係が続きます。簡単に言えば、GDの形状パラメーターが増加すると、GDの形状は正常になります。それが事実であることを証明することはより困難です。GDの場合、

GD(z;a,b)={baza1ezbΓ(a)z>00other.

GD形状パラメーターとして、GD形状はより対称的かつ正常になりますが、aの増加とともに平均が増加するにつれて、GDをa 1 √だけ左にシフトする必要がありますaaで固定し、最後に、シフトしたGDで同じ標準偏差を維持したい場合は、スケールパラメーター(b)を√に比例して減少させる必要があります(a1)1akb1a

つまり、GDを極限ケースNDに変換するにはすることで標準偏差を定数(に設定しますkb=1akz=(a1)1ak+x .

GD((a1)1ak+x; a, 1ak)={(ka)aeaxka+1((a1)ka+x)a1Γ(a)x>k(1a)a0other.

axa

lima(ka)aeaxka+1((a1)ka+x)a1Γ(a)=ex22k22πk=ND(x;0,k2)

Graphically for k=2 and a=1,2,4,8,16,32,64 the GD is in blue and the limiting ND(x;0, 22) is in orange, below

ここに画像の説明を入力してください

Second Let us make the point that due to the similarity of form between these distributions, one can pretty much develop relationships between the gamma and normal distributions by pulling them out of thin air. To wit, we next develop an "unfolded" gamma distribution generalization of a normal distribution.

Note first that it is the semi-infinite support of the gamma distribution that impedes a more direct relationship with the normal distribution. However, that impediment can be removed when considering the half-normal distribution, which also has a semi-infinite support. Thus, one can generalize the normal distribution (ND) by first folding it to be half-normal (HND), relating that to the generalized gamma distribution (GD), then for our tour de force, we "unfold" both (HND and GD) to make a generalized ND (a GND), thusly.

The generalized gamma distribution

GD(x;α,β,γ,μ)={γe(xμβ)γ(xμβ)αγ1βΓ(α)x>μ0other,

Can be reparameterized to be the half-normal distribution,

GD(x;12,πθ,2,0)={2θeθ2x2ππx>00other=HND(x;θ)

Note that θ=πσ2. Thus,

ND(x;0,σ2)=12HND(x;θ)+12HND(x;θ)=12GD(x;12,πθ,2,0)+12GD(x;12,πθ,2,0),

which implies that

GND(x;μ,α,β)=12GD(x;1β,α,β,μ)+12GD(x;1β,α,β,μ)=βe(|xμ|α)β2αΓ(1β),

is a generalization of the normal distribution, where μ is the location, α>0 is the scale, and β>0 is the shape and where β=2 yields a normal distribution. It includes the Laplace distribution when β=1. As β, the density converges pointwise to a uniform density on (μα,μ+α). Below is the generalized normal distribution plotted for α=π2,β=1/2,1,4 in blue with the normal case α=π2,β=2 in orange.

ここに画像の説明を入力してください

The above can be seen as the generalized normal distribution Version 1 and in different parameterizations is known as the exponential power distribution, and the generalized error distribution, which are in turn one of several other generalized normal distributions.


2

The derivation of the chi-squared distribution from the normal distribution is much analogous to the derivation of the gamma distribution from the exponential distribution.

これを一般化できるはずです:

  • もし バツパワー係数を持つ一般化正規分布からの独立変数m それから Y=nバツm スケーリングされたカイ2乗分布(「自由度」が n/m)。

類推は次のとおりです。

正規分布とカイ2乗分布は、平方和に関連しています

  • 複数の独立した標準正規分布変数の結合密度分布は、 バツ2
    fバツ1バツ2バツn=exp0.5=1nバツ22πn/2

  • もし バツN01

    それから =1nバツ2χ2ν

指数分布とガンマ分布は正規和に関連しています

  • 複数の独立した指数分布変数の結合密度分布は、 バツ

    fバツ1バツ2バツn=expλ=1nバツλn

  • もし バツEバツpλ

    それから =1nバツガンマnλ


導出は、すべてではなく統合された変数の変更によって行うことができます バツ1バツ2バツn代わりに、合計された期間のみです(これは、ピアソンが1900年に行ったことです)。これは、両方のケースで非常によく似ています。

のために χ2 分布:

fχ2nsds=es/22πn/2dVdsds=es/22πn/2πn/2Γn/2sn/21ds=12n/2Γn/2sn/21es/2ds

どこで Vs=πn/2Γn/2+1sn/2半径が2乗のnボールのn次元ボリュームs

ガンマ分布の場合:

fGnλsds=eλsλndVdsds=eλsλnnsn1nds=λnΓnsn1eλsds

どこで Vs=snnは、n- ポリトープのn次元の体積で、バツ<s


ガンマ分布は待ち時間として見ることができます Y のために nの合計として分布するポアソンプロセスの第5イベント n 指数分布変数。

Alecos Papadopoulosがすでに指摘したように、2乗法線変数の合計を「待機時間の良いモデル」にする深い関係はありません。ガンマ分布は、一般化された正規分布変数の合計の分布です。それが、この2つの組み合わせです。

ただし、合計のタイプと変数のタイプは異なる場合があります。ガンマ分布は、指数分布(p = 1)から導出されると、指数分布の解釈(待機時間)を取得しますが、逆になって二乗ガウス変数の合計に戻り、同じ解釈を使用することはできません。

指数関数的に減少する待機時間の密度分布と、ガウス誤差の密度分布は指数関数的に減少します(正方形で)。これは、接続された2つを見る別の方法です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.