DPとCRPの違いは何ですか?
中華レストランプロセス(CRP)は、整数のパーティションにまたがる分布です。ディフィレットの定理のおかげで、ディリクレプロセス(DP)への接続が存在します。
De Finettiの定理:無限に交換可能なランダムプロセスがあるとすると、結合確率は混合として表現されます。P (θ 1、... 、θ N)(θ1、… 、θN)p (θ1、… 、θN)
p (θ1、… 、θN)= ∫dP(G )∏i = 1NG (θ私)
確率変数。G
交換性の私たちはテーブルのインデックスのどちらかを気にしない(私たちはテーブルに名前を付けていない)、我々は特定のテーブルに顧客のオーダーを気にしないという性質手段。顧客の異なるセットへの分割は、私たちが関心を持っている唯一の構造です。これは、パーティションが与えられれば、テーブルへの顧客の特定の割り当てを知る必要がなく、各テーブルでの顧客の数を知るだけでよいことを意味します。
De Finettiの定理は、分布を見つけるのに役立ちません。それは存在すべきであると述べているだけです。G
ディリクレプロセスは、分布よりも前のプロセスです。非公式には、確率分布を投入し、そこからサンプリングすると、確率分布の後に確率分布が得られます。
両方の関係は、がディリクレプロセスからサンプリングされた場合、De Finettiの定理の方程式がこの特定の当てはまることを証明することによって確立できます。GGG
もし
G 〜D P(α 、H)
その後
p ({ θ(z= 0 )0、… 、θ(z=0 )ん0} 、…、{ θ(z= k )0、… 、θ(z= k)んk} )= αkΓ (α )Γ (α + n )Πi = 0kΓ (n私)
は、特定のパーティションの確率を通じてCRPによって記述されることに注意してください。ここで、はテーブルインデックス示します。また、はテーブルの顧客数です。完全を期すために、は次のとおりです。、Z = I I N I I D Pp (θ1、… 、θN)z= i私ん私私D P
{ G (A1)、… 、G (Ak)} 〜D 、I 、R I C H リットルのE T (α H(A1)、... 、α H(Ak))
この博覧会から明らかなのは、つながりがあることですが、些細なことではありません。また、私は入ってくる個々の顧客に対する条件付き分布という意味でCRPを記述しなかったことにも注意してください。これにより、CRPとDPの間にさらに別の概念的なステップが追加されます。私のアドバイス:それらの関係を直接理解することに不安を感じて、関係を再現するまで、共同および限界分布について説明することから始めてください。CRPは、DPからを取り除きます。G
結合確率とCRPの逐次的記述の関係については、[1]を参照してください。
交換可能性が保持されない場合はどうなりますか?
交換可能性が保持されない場合、DPまたはCRPについては説明しませんが、従属ディリクレプロセスと従属中華レストランプロセスについては説明しません。そして当然、それらの間の接続は失われます!
Gt〜D P(α 、H)HGtGt』
可能な他の多くの一般化があります。それらのいくつかは、パーティションおよび分布上の表現を認めます。たとえば、Pitman-Yorプロセスを持つ2つのパラメーターを持つ中華レストランプロセス、またはベータプロセスを持つインドビュッフェプロセス[3] 。それらのいくつかはしません。
- [1]:ベイジアンノンパラメトリックモデルのチュートリアル(2011)Gershman and Blei
- [2]:距離に依存する中華レストランのプロセス(2011)ブレイとフレイジャー
- [3]:階層的ベータプロセスとインドビュッフェプロセス(2007)ティボーとヨルダン