ガンマ分布を使用したディリクレ分布の構築


16

ましょうX1,,Xk+1互いに独立ランダム変数であり、パラメータを持つそれぞれ有するガンマ分布ショーをそのには、αi,i=1,2,,k+1Yi=XiX1++Xk+1,i=1,,kDirichlet(α1,α2,,αk;αk+1)

関節PDF次に関節を見つけるPDF私はヤコビアンすなわち見つけることができません(X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1)(Y1,,Yk+1)J(x1,,xk+1y1,,yk+1)


3
このドキュメントの 13-14ページをご覧ください。

@Procrastinatorあなたのドキュメントが私の質問に対するベストアンサーであることに感謝します。
アルガ

2
@Procrastinator-おそらくOPはそれに満足しているので、これを回答として入力し、「1文以上の回答が必要です」という警告につまずかないようにいくつかの文を追加する必要がありますか?
jbowman

4
それは404ですので、その文書は現在非答えです
whuber

2
救助へのウェイバックマシン:pdf
mobeets

回答:


28

ヤコビアン-変数関数の変化の絶対的な決定要因-は恐ろしいように見え、複雑になる可能性があります。それにもかかわらず、それらは変数の多変量変化の計算の不可欠で避けられない部分です。それは、そこのそれのために何も思えないだろうが、書き留めてによる誘導体の行列を計算を行います。k+1k+1

より良い方法があります。 最後に「ソリューション」セクションに表示されます。この投稿の目的は、多くの人にとって新しい方法となる可能性のあるものを統計学者に紹介することであるため、その多くはソリューションの背後にある機械の説明に専念しています。これは微分形式の代数です。(微分形式は、複数の次元に統合されるものです。)詳細で実用的な例が含まれており、これがより親しみやすくなります。


バックグラウンド

1世紀以上前、数学者は微分代数の理論を開発し、多次元幾何学で発生する「高次微分」と連携しました。行列式は、そのような代数によって操作される基本的なオブジェクトの特殊なケースであり、通常は交互の多重線形形式です。 これの美しさは、計算がどれほど簡単になるかにあります。

知っておくべきことはすべてここにあります。

  1. 差動「形式の表現である」。これは、「d」と任意の変数名の連結です。dxid

  2. 一形態が等差、の線形結合でありあるいはX 2 D X 1 - EXP X 2D 、X 2。つまり、係数は変数の関数です。dx1+dx2x2dx1exp(x2)dx2

  3. フォームを使用して「掛け」することができウェッジ積を書かれ、。この積は反可換性(交互とも呼ばれます)です。任意の2つの形式ωηに対して、ωη

    ωη=ηω.

    この乗算は線形かつ連想的です。つまり、使い慣れた方法で機能します。直接の結果は、ということである、いずれかのフォームの広場を意味していることは常にゼロです。これにより、乗算が非常に簡単になります!ωω=ωω

  4. 確率計算に現れる被積分関数を操作するために、ような式は|と理解できますD のx 1D のx 2D X のk + 1 | dx1dx2dxk+1|dx1dx2dxk+1|

  5. 場合、その差が微分で与えられる関数です。y=g(x1,,xn)

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

ヤコビアンとの関係は次のとおりです。変換のヤコビアンは、符号までは単にd xの係数(y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn))の計算に表示されていることdx1dxn

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

ルール(5)のd x jの線形結合として各を展開した後。dfidxj


このヤコビアンの定義の単純さは魅力的です。まだ価値があるとは思いませんか?デカルト座標から二次元積分変換の周知の問題考える極座標R θ X Y = R COS θ Rのθを。以下は、前述のルールを完全に機械的に適用したものです。ここで、「(x,y)(r,θ)(x,y)=(rcos(θ),rsin(θ))()「明らかに意味規則のおかげ(3)によって消え式短縮するために使用されるdrdr=dθdθ=0

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

The point of this is the ease with which such calculations can be performed, without messing about with matrices, determinants, or other such multi-indicial objects. You just multiply things out, remembering that wedges are anti-commutative. It's easier than what is taught in high school algebra.


Preliminaries

Let's see this differential algebra in action. In this problem, the PDF of the joint distribution of (X1,X2,,Xk+1) is the product of the individual PDFs (because the Xi are assumed to be independent). In order to handle the change to the variables Yi we must be explicit about the differential elements that will be integrated. These form the term dx1dx2dxk+1. Including the PDF gives the probability element

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.