ディリクレ分布から確率ベクトルをサンプリングするとはどういう意味ですか?


8

私は本質的に潜在ディリクレ配分について学んでいます。:私はここのビデオを見ているhttp://videolectures.net/mlss09uk_blei_tm/彼が分布からのサンプリングに説明し始めたとき分45時と立ち往生。

また、ディリケルト分布の詳細な紹介がない機械学習の本を調べてみました。私が読んでいる本では、ディリクレ分布から「確率ベクトル」をサンプリングする例を述べていましたが、それはどういう意味ですか?

分布からのサンプリングは、分布に従って確率変数のランダム値を取得することとして理解しています。したがって、p_X、Y(x、y)であるが、任意の分布のpmfであるとすると、この分布からのサンプリングは、ランダム(x、y)(つまり、xとyのランダム値)を取得することを意味します。イベントを取得する確率(X = x AND Y = y)を取得するために、分布のpmfを評価します...したがって、1つの数値のみを取得します。しかし、ここでは「確率ベクトル」とは何ですか!

その本のスクリーンショットを添付しました。私はあなたが助けることができることを本当に望みます!

ここに画像の説明を入力してください


2
確率ベクトルは、ディリクレ分布でサンプリングしたものだと思います。例:(0.5、0.4、0.1)はベクトルであり、3つのクラスを持つ変数の分布の比率/確率を表すために使用されます。
スクラッチを2014年

@Scratchは、3つのクラスを言ったとき、3つの離散値でのみ定義された確率変数を意味しますよね?
ジャックトウェイン2014年

1
したがって、基本的にディリクレの各サンプルは、Kクラスの分布を表します。
ジャックトウェイン2014年

2
はい、ディリクレ分布はこれらのタイプの問題のために作成されました:クラスの分布をシミュレートします。
スクラッチ

@Scratchあなたがここに私の質問を参照してくださいすることができますstats.stackexchange.com/questions/81136/...
ジャック・トウェイン

回答:


8

ディリクレ分布は、イベントを確率的にいくつかのカテゴリに分類するためによく使用されます。気象イベントがディリクレ分布をとるとします。次に、明日の天気は晴れの確率が0.25、雨の確率が0.5、雪の確率が0.25であると考えるかもしれません。これらの値をベクトルに収集すると、確率のベクトルが作成されます。

ディリクレ分布について考えるもう1つの方法は、棒を壊すプロセスです。単位長さのスティックを想像してみてください。そのスティックをどこでも破って、2つのピースの1つを保持します。次に、残りの部分を2つに分割し、必要に応じてこれを続けます。すべてのピースを合計すると、ユニット長に合計する必要があり、異なる長さに異なるピースを異なるイベントに割り当てると、そのイベントの確率を表します。

θθθθθB(α,β)α>ββ>α

P(θ<0.25)=0.5P(θ0.25)=0.5

ベータ分布を3つ以上のカテゴリに拡張すると、ディリクレ分布が得られます。実際、2つのグループのディリクレのPDFは、ベータ分布とまったく同じです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.