ガンマランダム変数の対数の歪度


16

考えてみましょガンマ確率変数 バツΓαθ。平均、分散、歪度にはきちんとした式があります。

E[バツ]=αθヴァール[バツ]=αθ2=1/αE[バツ]2歪度[バツ]=2/α

ここで、対数変換されたランダム変数考えますY=ログバツ。ウィキペディアには、平均と分散の公式があります。

E[Y]=ψα+ログθヴァール[Y]=ψ1α

ガンマ関数の対数の1次および2次導関数として定義されるディガンマおよびトリガンマ関数を介して。

歪度の式は何ですか?

テトラガンマ関数は表示されますか?

(これについて不思議に思ったのは、対数正規分布とガンマ分布の選択です。ガンマ対対数正規分布を参照してください。とりわけ、歪度特性が異なります。特に、対数正規の対数の歪度はゼロです。ガンマのログの歪度は負ですが、どの程度負ですか?..)


1
、このヘルプは?それともこれ
S. Kolassa -復活モニカ

私は、対数ガンマ分布が何であるかよくわかりません。lognormalがnormalに関連しているのでガンマに関連している場合、何か他のことを尋ねています(紛らわしいことに "lognormal"はlog(normal)ではなくexp(normal)の分布です)。
アメーバは、モニカを復活

1
@Glen_b:正直に言うと、通常の指数関数を「lognormal」と呼ぶことは、はるかに一貫性がなく、紛らわしいと思います。残念ながら、より確立されています。
S. Kolassa -復活モニカ

2
それが反対より明確に確立条約のも対数ロジスティック、対数コーシーを、ログインラプラスなどなど参照@Stephan
Glen_b -Reinstateモニカ

1
うん; このため、この分布に関連して「ログガンマ」をどこにも言わないように注意しました。(私は過去に対数正規に一貫した方法でそれを使用しました)
Glen_b -Reinstate Monica

回答:


12

積率母関数Yは= LN Xは、それが単純な代数的形状を有しているので、この場合に有用です。mgfの定義により、M t MtY=lnバツ

M(t=E[etlnバツ]=E[バツt]=1Γαθα0バツα+t1eバツ/θdバツ=θtΓα0yα+t1eydy=θtΓα+tΓα

あなたが与えた期待と分散を検証しましょう。導関数をとると、M"T=Γ"α+T

Mt=Γα+tΓαθt+Γα+tΓαθtlnθ
したがって、E[Y]=ψ0α+lnθ
M(t)=Γα+tΓαθt+2Γα+tΓαθtlnθ+Γα+tΓαθtln2θ
その後、VarY=E[Y2]E[Y]2=Γα
E[Y]=ψ(0)(α)+ln(θ),E[Y2]=Γ(α)Γ(α)+2ψ(0αlnθ+ln2θ
Var(Y)=E[Y2]E[Y]2=Γ(α)Γ(α)(Γ(α)Γ(α))2=ψ(1)(α).

歪度を見つけるために、(チップのためのおかげで@probabilityislogic)キュムラント生成関数を注意することであるしたがって、最初のキュムラントは単純にK 0 = ψ 0 α + ln θ です。それを思い出します

K(t)=lnM(t)=tlnθ+lnΓ(α+t)lnΓ(α).
K(0)=ψ(0)(α)+ln(θ、後続のキュムラントであるので、 K N 0 = ψ N - 1 α N 2。したがって、歪度は E [ Y E [ Y ] 3ψ(n)(x)=dn+1lnΓ(x)/dxn+1K(n)(0)=ψ(n1)(α)n2
E[(YE[Y])3]Var(Y)3/2=ψ(2)(α)[ψ(1)(α)]3/2.

注意点として、この特定の分布は徹底的に自分の中でAC Olshenによって研究されているように見えたピアソンタイプIII分布の変換、Johnsonらの連続変量分布は、また、それについての小片を持っています。それらをチェックしてください。


3
差別化する必要があります Kt=ログ[Mt]=tログ[θ]+ログ[Γα+t]ログ[Γα] の代わりに Mt これはキュムラント生成関数であるためです-より直接中心モーメントに関連しています- skew=K30=ψ2α どこ ψnzはポリガンマ関数です
確率は

1
@probabilityislogic:非常に良い電話、私の答えを変えました
フランシス

@probabilityislogic This is a great addition, thanks a lot. I just want to note, lest some readers be confused, that skewness is not directly given by the third cumulant: it's the third standardized moment, not the third central moment. Francis has it correct in his answer, but the last formula in your comment is not quite right.
amoeba says Reinstate Monica

13

I. Direct computation

Gradshteyn & Ryzhik [1] (sect 4.358, 7th ed) list explicit closed forms for

0xν1eμx(lnx)pdx
for p=2,3,4 while the p=1 case is done in 4.352 (assuming you regard expressions in Γ,ψ and ζ functions as closed form) -- from which it is definitely doable up to kurtosis; they give the integral for all p as a derivative of a gamma function so presumably it's feasible to go higher. So skewness is certainly doable but not especially "neat".

Details of the derivation of the formulas in 4.358 are in [2]. I'll quote the formulas given there since they're slightly more succinctly stated and put 4.352.1 in the same form.

Let δ=ψ(a)lnμ. Then:

0xa1eμxlnxdx=Γ(a)μa{δ}0xa1eμxln2xdx=Γ(a)μa{δ2+ζ(2,a)}0xa1eμxln3xdx=Γ(a)μa{δ3+3ζ(2,a)δ2ζ(3,a)}0xa1eμxln4xdx=Γ(a)μa{δ4+6ζ(2,a)δ28ζ(3,a)δ+3ζ2(2,a)+6ζ(4,a))}

where ζ(z,q)=n=01(n+q)z is the Hurwitz zeta function (the Riemann zeta function is the special case q=1).

Now on to the moments of the log of a gamma random variable.

Noting firstly that on the log scale the scale or rate parameter of the gamma density is merely a shift-parameter, so it has no impact on the central moments; we may take whichever one we're using to be 1.

If XGamma(α,1) then

E(logpX)=1Γ(α)0logpxxα1exdx.

We can set μ=1 in the above integral formulas, which gives us raw moments; we have E(Y), E(Y2), E(Y3), E(Y4).

Since we have eliminated μ from the above, without fear of confusion we're now free to re-use μk to represent the k-th central moment in the usual fashion. We may then obtain the central moments from the raw moments via the usual formulas.

Then we can obtain the skewness and kurtosis as μ3μ23/2 and μ4μ22.


A note on terminology

It looks like Wolfram's reference pages write the moments of this distribution (they call it ExpGamma distribution) in terms of the polygamma function.

By contrast, Chan (see below) calls this the log-gamma distribution.


II. Chan's formulas via MGF

Chan (1993) [3] gives the mgf as the very neat Γ(α+t)/Γ(α).

(A very nice derivation for this is given in Francis' answer, using the simple fact that the mgf of log(X) is just E(Xt).)

Consequently the moments have fairly simple forms. Chan gives:

E(Y)=ψ(α)

and the central moments as

E(YμY)2=ψ(α)E(YμY)3=ψ(α)E(YμY)4=ψ(α)

and so the skewness is ψ(α)/(ψ(α)3/2) and kurtosis is ψ(α)/(ψ(α)2). Presumably the earlier formulas I have above should simplify to these.

Conveniently, R offers digamma (ψ) and trigamma (ψ) functions as well as the more general polygamma function where you select the order of the derivative. (A number of other programs offer similarly convenient functions.)

Consequently we can compute the skewness and kurtosis quite directly in R:

skew.eg <- function(a) psigamma(a,2)/psigamma(a,1)^(3/2)
kurt.eg <- function(a) psigamma(a,3)/psigamma(a,1)^2

Trying a few values of a (α in the above), we reproduce the first few rows of the table at the end of Sec 2.2 in Chan [3], except that the kurtosis values in that table are supposed to be excess kurtosis, but I just calculated kurtosis by the formulas given above by Chan; these should differ by 3.

(E.g. for the log of an exponential, the table says the excess kurtosis is 2.4, but the formula for β2 is ψ(1)/ψ(1)2 ... and that is 2.4.)

Simulation confirms that as we increase sample size, the kurtosis of a log of an exponential is converging to around 5.4 not 2.4. It appears that the thesis possibly has an error.

Consequently, Chan's formulas for central moments appear to actually be the formulas for the cumulants (see the derivation in Francis' answer). This would then mean that the skewness formula was correct as is; because the second and third cumulants are equal to the second and third central moments.

Nevertheless these are particularly convenient formulas as long as we keep in mind that kurt.eg is giving excess kurtosis.

References

[1] Gradshteyn, I.S. & Ryzhik I.M. (2007), Table of Integrals, Series, and Products, 7th ed.
Academic Press, Inc.

[2] Victor H. Moll (2007)
The integrals in Gradshteyn and Ryzhik, Part 4: The gamma function
SCIENTIA Series A: Mathematical Sciences, Vol. 15, 37–46
Universidad Técnica Federico Santa María, Valparaíso, Chile
http://129.81.170.14/~vhm/FORM-PROOFS_html/final4.pdf

[3] Chan, P.S. (1993),
A statistical study of log-gamma distribution,
McMaster University (Ph.D. thesis)
https://macsphere.mcmaster.ca/bitstream/11375/6816/1/fulltext.pdf


1
涼しい。どうもありがとう!ステファンが上記にリンクした百科事典のエントリによると、歪度の最終的な答えはψα/ψα3/2(これはほとんど「ニート」と見なされます!)。だから、すべての恐ろしいゼータはキャンセルする必要があるようです。
アメーバは、モニカを復活させる

1
あなたのコメントを見ただけで申し訳ありません(私は約1時間ほど編集しています); それは正しいですが、百科事典がチャンが彼の論文でそれを与えるように尖度を与える場合、それは間違っているようです(上記のように)が、すぐに修正されます。きちんとした式は、標準化された中心モーメントではなく、キュムラント用です。
Glen_b-モニカを

はい、百科事典は尖度に対して同じ公式を与えています。
アメーバは、モニカを復活させる

うーん、私は通常示されているものを参照することを意味します γ1 そして γ2。修正します。
Glen_b-モニカを復活させる

2
おそらく、Hurwitzゼータ関数はポリガンマ関数で表現でき、逆も同様であるという注意を追加する必要があります
ψnz=1n+1Γn+1ζn+1z
それで、@ amoebaの質問「テトラガンマ関数は表示されますか?」はい。
JMは統計学者ではありません
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.