ディリクレ分布でシンプレックスを三角形サーフェスとして表すことの意味は?


9

Dirchiletの分布を紹介し、それについて図を示した本を読んでいます。しかし、私はそれらの数字を本当に理解することができませんでした。こちらの図を下に貼りました。私が理解していないのは、三角形の意味です。

通常、2つの変数の関数をプロットする場合は、var1とva2の値を取得してから、これら2つの変数の関数値の値をプロットします。これにより、3D次元で視覚化できます。しかし、ここには3つの次元と関数値の他の1つの値があるため、4D空間で視覚化されます。それらの数字が理解できません!

誰かがそれらを明確にしてくれることを願っています!

編集:これは、図2.14aから理解できないことです。したがって、K = 3ディリクレからサンプルtheta(基本的にはベクトル)、つまりtheta = [theta1、theta2、theta3]を描画しました。三角形は[theta1、theta2、theta3]をプロットします。原点から各theta_iまでの距離は、theta_iの値です。次に、theta_iごとに頂点を配置し、3つの頂点すべてを接続して三角形を作成します。[theta1、theta2、theta3]をdir(theta | a)に接続すると、ベクトルthetaの同時確率である1つの数値が得られることを知っています。また、連続確率変数の確率が面積の尺度であることも理解しています。しかし、ここには3次元があるので、結合確率はピンク色の平面とその下からの空間の体積の尺度になります...ピラミッド。ここで三角形の役割が何なのかわかりません。

ここに画像の説明を入力してください


2
ベータ配布から始めて、そこから作業することをお勧めします。3のディリクレはベータ版の論理的な拡張であり、2のディリクレである
Andris Birkmanis

例えば、このスレッドをチェックしてください:stats.stackexchange.com/questions/244917/...
ティム

ベータ分布は2D(x軸は{0,1}バイナリの結果を表し、y軸は確率を表す)で表示されると考えると参考になります。したがって、3値の結果には追加の次元が必要です。
ジョージ

回答:


4

ここで三角形の役割が何なのかわかりません。コミュニケーションまたは視覚化しようとしていることは何ですか?

0θ1θ0+θ1+θ2=1

私が最終的にそれを理解した方法は次のとおりです:

図

θ1,2,3

(b)では、三角形が表示されています。これがシンプレックスです。

(c)は、2番目の基準(合計で1つ)も満たす、シンプレックス上に「横たわる」2つのポイントの例を示します。

(d)シンプレックス上の別の例のポイントを示し、同じ制約が成り立つ

(e)では、2次元の三角形へのシンプレックスの投影を、前に示したすべてのサンプルポイントとともに表示しようとしました。

今それがもっと理にかなっていると思います:)


2
素敵な写真。あなたの物ですか?いいえの場合、参照とそのソースを提供していただけませんか?
Tim

1
ありがとう。それは私のものです(Inkscapeを使用して描画)、必要に応じてSVGを提供できます...
John Doe

2

θik=3θ。次に、その平面を傾けて、ページに平らに置かれた、ピンク色の平面(読者に最も近い面)のピラミッドを作成するとします。次に、ページの3番目の次元の「飛び出し」を抑制し、代わりに三角形に色を付けて、ベースから表面までの距離が長い高密度領域がより赤くなるようにします。それがグラフ2.14(b)と2.14(c)が示すものです。赤が頂点の近くに集中しているほど、その頂点に関連付けられているクラスの確率が高くなります。同様に、赤い領域がどの頂点にも非常に近くない場合、イベントがいずれかのクラスに属する可能性が高い可能性は特にありません。

θθθk=3θθDir(α)


まだはっきりしない点もある。たぶん私の弱い英語が好きだ。「ピンク色の平面と軸の平面で囲まれた領域が密度です。」それはピンク色の飛行機の下のピラミッドの空きスペースですか?「密度」も?どういう意味ですか?私が理解しているように、dir(x1、x2、x3)は1つの値であるということですが、ここでの密度はどのようにグラフに入りますか?
ジャックトウェイン

はい、ピンクの平面と2.14(a)の黒い線で形成された平面の間が、私が説明しようとしていたピラミッドの空間です。混乱させて申し訳ありません!
Sycorax氏は、モニカを2014

私はまだ明確ではないことをさらに説明するために私の投稿を編集します
ジャック・トウェイン

ピンク色の領域は、まさに本に記載されているサポートです。theta_k <= 1およびsum(theta_k)= 1であるため。あなたがそれを想像したら、user777は完全に正しいです。
スクラッチを2014年

@ user777投稿を編集しました
Jack Twain
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.