ディリクレ分布のアルファとは正確には何ですか?


26

私はベイジアン統計にかなり慣れていないので、アルゴリズムのバックエンドでディリクレプロセスを使用する修正された相関測定SparCCに出会いました。何が起こっているのかを実際に理解するために段階的にアルゴリズムを試してみましたがalpha、ディリクレ分布でベクトルパラメーターが何をするのか、ベクトルパラメーターをどのように正規化するのか正確にはわかりませんかalpha

実装は以下をPython使用していNumPyます:https : //docs.scipy.org/doc/numpy/reference/generated/numpy.random.dirichlet.html

ドキュメントは言う:

alpha:分布の配列パラメーター(次元kのサンプルのk次元)。

私の質問:

  1. alphas分布にどのような影響がありますか?;

  2. どのようalphasに正規化されていますか?; そして

  3. alphasが整数でない場合はどうなりますか?

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Reproducibility
np.random.seed(0)

# Integer values for alphas
alphas = np.arange(10)
# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

# Dirichlet Distribution
dd = np.random.dirichlet(alphas) 
# array([ 0.        ,  0.0175113 ,  0.00224837,  0.1041491 ,  0.1264133 ,
#         0.06936311,  0.13086698,  0.15698674,  0.13608845,  0.25637266])

# Plot
ax = pd.Series(dd).plot()
ax.set_xlabel("alpha")
ax.set_ylabel("Dirichlet Draw")

ここに画像の説明を入力してください


6
このディストリビューションのウィキペディアのエントリに問題がありますか?
西安

2
おologiesび申し上げます、私はそれを正しく言い表したとは思いません。確率分布/ pdf / pmfが何であるかは理解していますが、正規化がどのように行われているかについては混乱していました。ウィキペディアから、正規化後にガンマ関数を経由して発生しているようだ。私はそれがディストリビューション上のディストリビューションと呼ばれることを聞いたことがあり、ウィキペディアのeqnsからそれを見ることは難しいです。xiα1
O.rka

1
アルファを正規化すると、分布の平均が得られます。分布を正規化すると、そのサポートに対する積分が1に等しくなり、有効な確率分布になることが保証されます。
エスカップ

1
ディリクレ分布は、シンプレックス上の分布であるため、有限サポート分布上の分布です。連続分布を超える分布を目指す場合、ディリクレ過程を調べる必要があります。
西安

回答:


66

ディリクレ分布を記述する多変量確率分布であり、変数X 1... Xのkは、そのような各そのX I0 1 Σ N iは= 1、X iは = 1、ベクトルによってパラメータ化されます正の値のパラメーターの。パラメーターk2X1,,Xkxi(0,1)i=1Nxi=1α=(α1,,αk)整数である必要があり、正の実数である必要があります。それらは決して「正規化」されておらず、この分布のパラメーターです。

ディリクレ分布は、ベータ分布を複数の次元に一般化したものなので、ベータ分布について学習することから始めることができます。ベータは、パラメーターおよびパラメーター化されたランダム変数単変量分布です。あなたはそれがあることを思い出した場合、それについての素晴らしい直感が来共役事前のための二項分布と我々は前によってパラメータベータ仮定した場合と二項分布の確率パラメータのため、その後の事後分布もありますパラメータ化されたベータ分布α βX(0,1)αββ P 、P α ' = α + 成功回数β ' = β + 失敗回数α βαβppα=α+number of successesと。したがって、およびは、成功および失敗の疑似カウント(整数である必要はありません)と考えることができます(このスレッドもチェックしてください)。β=β+number of failuresαβ

ディリクレ分布の場合には、それは前に共役であるため多項分布。二項分布の場合、白と黒のボールを骨から置換することで考えることができる場合、多項分布の場合、置換ボールが色で表示され、各色が表示されますのボールは確率で描くことができます。ディリクレ分布は、確率の共役事前分布であり、パラメーターは color的に仮定され各色のボールの擬似カウントと考えることができますK P 1... P K P 1... PのK α 1··· α K α 1··· α K α 1 + N 1··· α K + N KNkp1,,pkp1,,pkα1,,αk(しかし、そのような推論落とし穴についても読むべきです)。ディリクレ多項モデルでは、は、各カテゴリで観測されたカウントで合計することにより更新されます:ベータ二項モデルの場合と同様の方法でα1,,αkα1+n1,,αk+nk

値が大きいほど、「重み」が大きくなり、合計「質量」の量が大きくなります(合計ででなければならないことを思い出してください)。すべてのが等しい場合、分布は対称です。場合、それはプッシュ離れること抗重みとして考えることができるが高い場合、それは引き付けながら、極端に向かって、全ての点がその周りに集中しているという意味で、中央(いくつかの中心値に向けないで対称的に中央にあると感じます)。場合、次いで点が均一に分布しています。X I 、X 1 + + X K = 1 α I α I < 1 、X I 、X I α 1 = = α K = 1αiXix1++xk=1αiαi<1xixiα1==αk=1

これは、以下のプロットで見ることができます。そこでは、(a)、(b)パラメーター化された三変量ディリクレ分布を見ることができます(残念ながら、最大3次元までの合理的なプロットを作成できます)、(c)、(d)。α 1 = α 2 = α 3 = 10 α 1 = 1 α 2 = 10 α 3 = 5 α 1 = α 2 = α 3 = 0.2α1=α2=α3=1α1=α2=α3=10α1=1,α2=10,α3=5α1=α2=α3=0.2

ディリクレ分布からの4つの異なるサンプル

ディリクレ分布は、確率分布そのものと考えることができるため、「分布上の分布」と呼ばれることもあります。各およびであるため、は1番目と2番目の確率の公理と一致することに注意してください。したがって、ディリクレ分布は、カテゴリカル多項分布などの分布によって記述される離散イベントの確率分布として使用できます。それはありません、σ kはiが= 1、X iは = 1つの、X I kはxi(0,1)i=1kxi=1xiそれは、あらゆる分布にわたる分布であり、たとえば、連続ランダム変数の確率、またはいくつかの離散変数とは関係ありません(たとえば、ポアソン分布確率変数は、任意の自然数である値を観測する確率を記述するため、それらの確率に対するディリクレ分布には、無限個のランダム変数が必要です。k


2
信じられないほどの説明
-O.rka

14

免責事項:私は以前このディストリビューションで働いたことはありません。この答えは、このウィキペディアの記事と私の解釈に基づいています。


ディリクレ分布は、ベータ分布と同様の特性を持つ多変量確率分布です。

PDFは次のように定義されます。

{x1,,xK}1B(α)i=1Kxiαi1

K2xi(0,1)i=1Kxi=1

密接に関連するベータ分布を見ると:

{x1,x2(=1x1)}1B(α,β)x1α1x2β1

K=2K>2


β α 1 α 2 Aαβα1α2ABα1,pos=α1+Aα2,pos=α2+B

x1x2(=1x1)AB


K=2KK=2Kxi

αiα1α2xiと同様の方法で更新されます。

だから今あなたの質問に到達する:

alphas分布にどのような影響がありますか?

xi(0,1)i=1Kxi=1αiKi=1Kαixi、または各結果の確率。これは、密度がより集中することを意味します。

どのようalphasに正規化されていますか?

B(α)

B(α)=i=1KΓ(αi)Γ(i=1Kαi)

K=2

B(α1,α2)=Γ(α1)Γ(α2)Γ(α1+α2)

これは

B(α)=Γ(α1)Γ(α2)Γ(αK)Γ(α1+α2++αK)

アルファが整数でない場合はどうなりますか?

αi>1αi<1xiKK2


1
これをありがとう。あなたの説明はとても役に立ちました。両方とも正しいとマークできたらよかったのに。
-O.rka
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.