Multinomial(1 / n、…、1 / n)は、離散化されたディリクレ(1、..、1)として特徴付けられますか?


24

そのため、この質問は少し厄介ですが、それを補うためにカラフルなグラフを含めます!最初に背景、次に質問。

バックグラウンド

あなたが持っていると言う以上の等しいprobailitesと次元の多項分布カテゴリを。してみましょう正規化数(可能:つまり、その分布から)、N π = π 1... π NCnnπ=(π1,,πn)c

(c1,,cn)Multinomial(1/n,,1/n)πi=cin

現在、を介した分布は -simplexをサポートしていますが、個別のステップがあります。たとえば、場合、この分布には次のサポートがあります(赤い点):N 、N = 3πnn=3

ここに画像の説明を入力してください

同様のサポートを備えた別の分布は、次元の分布、つまり単位シンプレックス上の均一な分布です。たとえば、次は3次元の 1、1、1)からのランダムな描画です。ディリクレ1 ... 1 ディリクレ1 1 1 nDirichlet(1,,1)Dirichlet(1,1,1)

ここに画像の説明を入力してください

今、分布からのの分布は、個別サポートに離散化されます。私が念頭に置いていた(そしてうまく機能しているように見える)離散化は、シンプレックスの各ポイントを取得し、サポートしている最も近いポイントに「丸め」ます。3次元シンプレックスの場合、各色付き領域のポイントが最も近い赤いポイントに「丸められる」次のパーティションを取得します。多項式1 / n 1 / n ディリクレ1 1 ππMultinomial(1/n,,1/n)Dirichlet(1,,1)ππ

ここに画像の説明を入力してください

ディリクレ分布は均一であるため、各ポイントの結果の密度/確率は、各ポイントに「丸められる」面積/体積に比例します。2次元および3次元の場合、これらの確率は次のとおりです。

ここに画像の説明を入力してくださいこれらの確率は、モンテカルロシミュレーションからのものです

したがって、少なくとも2次元と3次元では、この特定の方法でを離散化した結果の確率分布は確率分布と同じように見え。これは、分布の正規化された結果です。私も4次元で試しましたが、うまくいくようです。π 多項1 / n 1 / n Dirichlet(1,,1)πMultinomial(1/n,,1/n)

質問

私の主な質問は:

この特定の方法で一様なディリクレを離散化するとき、はさらなる次元に適用されますか?関係はまったく成り立っていますか?(モンテカルロシミュレーションを使用してこれを試しました...)Multinomial(1/n,,1/n)

さらに疑問に思う:

  • この関係が成り立つ場合、それは既知の結果ですか?そして、私がこれを引用できるソースはありますか?
  • 均一なディリクレのこの離散化に多項式とのこの関係がない場合。似たような構造がありますか?

コンテキスト

この質問をする理由は、ノンパラメトリックブートストラップとベイジアンブートストラップの類似性を見ているからです。また、上記の3次元シンプレックスの色付きの領域のパターンは、ボロノイ図のように見えることに気づきました。これについては、PascalのTriangle / Simpex(http://www.math.rutgers.edu/~erowland/pascalssimplices.html)のシーケンスとして考えることができます(願っています)。色付きの領域のサイズは、2次元の場合はパスカルの三角形の2行目、3次元の場合はパスカルの四面体の3行目などに続きます。これは多項分布との関係を説明しますが、ここでは本当に深海にいます...


2
楽しい!(いつものように。)しかし、私は靴下の接続が恋しいです。
西安

まあ、私は靴下を交換して描き始めました。しかし、その後、私はベイジアンブーストラップについて考え始めました。1つのことが別のことにつながり、それが私がここに
たどり着いた

2
@ Xi'an多分それはベイジアンのマスコットになるはずの子犬ではなく靴下ですか?
ティム

回答:


14

これらの2つの分布は、ごとに異なります。n4

表記法

ラティスポイントが整数座標を持つように、シンプレックスを係数で再スケーリングします。これは何も変更しません。表記法が少し面倒ではなくなると思います。n

LETである -simplex、点の凸包として与えられる、...、における。言い換えると、これらはすべての座標が負ではなく、座標の合計がです。n 1 n 0 0 0 0 n R n nS(n1)(n,0,,0)(0,,0,n)Rnn

してみましょう一連の示す格子点すなわちでそれらの点、すべての座標が不可欠です。SΛS

場合格子点であり、我々はせその意味ボロノイセル内のこれらの点として定義され、近い(厳密に)である内の他の点よりも。V P S P ΛPVPSPΛ

配置できる2つの確率分布を配置します。一点多項分布であり、1nは確率持つ2 - N、N /a 1a n。もう1つはディリクレモデルと呼び、各にの体積に比例する確率をます。Λ(a1,...,an)2nn!/(a1!an!)V PPΛVP

非常に非公式の正当化

、多項モデルとディリクレモデルはで異なる分布を与えると主張しています。N 4Λn4

これを確認するには、場合と、ポイントおよびます。とは、ベクトルによる変換によって合同であると主張します。これは、と体積が同じであり、したがって、とがディリクレモデルで同じ確率を持つことを意味します。一方、多項モデルでは、異なる確率(と)があります。分布を等しくすることはできません。A = 2 2 0 0 )、B = 3 1 0 0 V A 、V B1 - 1 0 0 V A V B A B 2 - 44 /2 2 2 4n=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,1,0,0)VAVBAB244!/(2!2!)244!/3!

とが合同であるという事実は、次のもっともらしいが、非自明な(そして幾分曖昧な)主張に従う。V BVAVB

妥当項:形状及びサイズ唯一の「直接隣接」によって影響される、(IEのこれらの点異なるベクトルによってそのように見える、およびは他の場所にある場合があります) P Λ P 1 - 1 0 ... 0 1 - 1VPPΛP(1,1,0,,0)11

との「イミディエートネイバー」の設定が同じであることが簡単にわかり、とが一致していることがわかります。B V A V BABVAVB

場合、と同じゲームをプレイできます、たとえば。A = 2 2 N - 4 0 ... 0 )、B = 3 1 N - 4 0 ... 0 n5A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)

私はこの主張が完全に明白だとは思わないし、少し異なる戦略の代わりにそれを証明するつもりはない。ただし、これは分布が異なる理由に対するより直感的な答えだと思います。n4

厳格な証拠

上記の非公式の正当化のように、とを取る。とが一致していることを証明するだけです。B V A V BABVAVB

所与、我々は定義する次のように点の集合であり、、そのため。(よりやすい方法で:ますは、最高と最低の差が1より小さい点のセットです。)W P W PX 1... xはNS maxの1 I NI - P I- 1 I NA ip i< 1 v i = aP=(p1,,pn)ΛWPWP(x1,,xn)Smax1in(aipi)min1in(aipi)<1W P v ivi=aipiWPvi

ことを示します。VP=WP

ステップ1

クレーム:VPWP

これは非常に簡単ですがないとます。ましょう、その(一般性を失うことなく)仮定、。以来、我々はまた、知っている。W P 、V iは = X I - pはiがV 1 = 最大1 I N、V 、I 、V 2 = 1つのiがN V I V 1 - V 21 n i = 1 v i = 0 v 1X=(x1,,xn)WPvi=xipiv1=max1inviv2=min1inviv1v21i=1nvi=0v1>0>v2

今してみましょう。以来と両方とも非負の座標を持って、そうする、それが次のことをなど。一方、。したがって、は少なくともと同じくらい近いため、です。これは、ことを(補数をとることにより)示しています。P X Q Q S Q ΛのD I S T 2X P - D iは、S 、T 2X Q = v 2 1 + v 2 2Q=(p1+1,p21,p3,,pn)PXQQSQΛX Q P X V P V PW Pdist2(X,P)dist2(X,Q)=v12+v22(1v1)2(1+v2)2=2+2(v1v2)0XQPXVPVpWP

ステップ2

クレーム:はペアごとにです。WP

そうでないと仮定します。LET及びにおいて異なる点である 、およびlet。以来、及びではっきりと共に、一つのインデックスが存在しなければならない、および1つここで。一般性を失うことなく、およびと仮定します。替えて加算すると、ます。Q = Q 1... q個のNΛ X W PW Q P Q Λ I P IのQ I + 1つのP IQ I - 1 、P 1Q 1 + 1 、P 2Q 2 -P=(p1,,pn)Q=(q1,,qn)ΛXWPWQPQΛipiqi+1piqi1p1q1+1Q 1 - P 1 + P 2 - Q 22p2q21q1p1+p2q22

ここで、数字とについて考えてみましょう。であるという事実から、です。同様に、、意味します。これらをすると、になり、矛盾がます。X 2 X W P X 1 - P 1 - X 2 - P 2< 1 X W Q X 2 - Q 2 - X 1 - 、Q 1< 1 、Q 1 - P 1 + P 2q 2 < 2x1x2XWPx1p1(x2p2)<1XWQx2q2(x1q1)<1q1p1+p2q2<2

ステップ3

私たちは、ことが示されている、及びその互いに素です。カバーは測度ゼロの集合まで、それが続くこと(尺度ゼロのセットまで)。[とは両方とも開いているため、実際にはますが、これは必須ではありません。]W P V P S W P = V P W P V 、P W P = V PVPWPWPVPSWP=VPWPVPWP=VP

これでほぼ完了です。点および考慮してください。とが一致しており、相互に平行移動していることは簡単にわかります。両者が異なる唯一の方法は、の境界(と両方が横たわる面を除く)が「カットオフ」する場合ですまたはいずれかで、もう一方はありません。しかし、の境界のそのような部分に到達するには、または 1つの座標を少なくとも1だけ変更する必要があります。これは、から抜け出すのにB = 3 1 N - 4 0 ... 0 W A 、W B S A B W A 、W B S A B W A W B S A B W A W B W AA=(2,2,n4,0,,0)B=(3,1,n4,0,,0)WAWBSABWAWBSABWAそしてとにかく。したがって、は見晴らしの良いポイントおよびとは異なって見えますが、その違いはおよび定義によってするには遠すぎるため、とは一致しています。WBSABWAWBWAWB

したがって、とボリュームは同じであるため、多項モデルで確率が異なっていても、ディリクレモデルは同じ確率を割り当てます。V BVAVB


うわー、厳しい!ありがとう!だから私は偶然のI推測したために期待していたわずかな対応...
ラスマス・バース
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.