ディリクレ分布のPDFが1に統合されていないように見えるのはなぜですか?


8

Rのシンプレックス上でディリクレ密度関数との積を積分することにより、ディリクレ分布を持つ確率変数の関数の期待値を見つけようとしています。

Rに正しい関数を適用しているかどうかを確認するために、密度関数をシンプレックス全体に統合しようとしましたが、1になると期待していましたが、sqrt(n)にn個のカテゴリーが統合されたディリクレ分布の密度関数( RパッケージSimplicialCubature)。

これは間違っているはずだと思いましたが、次に2つのカテゴリの密度関数を見て、alphas =(1,1)の場合を考えてみます。次に、密度関数は一様に1になります(https://en.wikipedia.org/wiki/Dirichlet_distributionから密度関数を取ります)。したがって、1シンプレックス上の密度関数の積分は、1シンプレックスの長さを与えるだけです。しかし、Rコードで見つけたように、これはsqrt(2)です。

ここで何が欠けていますか?

回答:


12

2つの変数を使用して、指摘したように、で線分を定義しています。ただし、シンプレックス制約のため、x 1x 2の間には1対1の関係があるため、密度を指定するという点でこれら2つの変数の1つは冗長です。したがって、密度はK 1個の自由変数(すなわちR)で指定されます。R2バツ1バツ2K1R

ウィキペディアの記事のこのセクションの最初の行で、非常に微妙ではありますが、これは実際に指摘されています。

したがって、密度関数は次のようになります。

Dr11バツ11バツ1=Γ2Γ12バツ101バツ10=1

したがって、

01Dr11バツ11バツ1dバツ1=1

OPコメントへの応答

シンプレックス制約のため、上記の構成で示されているように、2変数ディリクレ密度は実際にはR 2縮退しています(1変数しか必要ありません)。それが真である間、それはの密度持つ1を、それの密度有さない1結ぶ線分上の1 0 0 1 。上記の構造は、限界密度の値が1であることを示しています。あなたの混乱は、x 2を自由変数として考えることから生じます。その場合、ディリクレのサポートはR21110011バツ2はゼロ以外の領域があります。この直感は、2変量ガウスのように、2つの変数が完全に相関していない場合には問題ありませんが、この場合はそうではありません。R2

これは次のように正式に導出できます。

してみましょうでいくつかの数である[ 0 Lからの距離を指定する1001を結ぶ線分に沿っ。したがって、Lの各値は一意のx1x2ペアを識別します。この表記法を使用すると、この線に沿って密度が1であるという仮定は、次のようになります。[02]1001Lバツ1バツ21

PL[ab]=ba

ただし、これは結合密度の正式な処理を通じてそうではないことを示すことができます。バツ1バツ2

PLL[ab]=Pバツ1バツ2[バツ1バツ2[ab]]

ここで[ab]:={あなたvあなた[1b21a2]v=1あなた]

それでは、計算させるPLL[ab]

PLL[ab]=[ab]dPバツ1バツ2=[ab]dPバツ1dPバツ2|バツ1=[ab]1dPバツ1=1b21a21dあなた=

1a21b2=12ba

3番目の等式が生じるのは、X 2 = 1 - X 1(すなわち、そのない密度、しかしの点確率質量1 - X 1dPバツ2|バツ1=1バツ2=1バツ11バツ1

ご覧のとおり、1を回復しました12R212


1
多くの感謝、私はあなたが書いたものの論理に同意しますが、関数が定数値1を持ち、線の長さがsqrt(2)であるという事実を考えると、それを二乗することはできません。では、なぜ積分はsqrt(2)を与えるべきではないのですか?
EBartrum、2015年

@EBartrum 7:30 EDT前後に説明を追加します

3
@EBartrumは、投稿を完成させるためにいくつかの詳細を追加しました(私はあなたがすでに承諾していることを知っていますが、他の人は追加の詳細が必要な場合があります)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.