4
ディリクレプロセスモデルの理解と実装
私は、データをクラスター化するためのディリクレプロセスを実装および学習しようとしています(または機械学習の人々が話すように、密度を推定しています)。 私はこのトピックについてたくさんの紙を読み、アイデアを思いつきました。しかし、私はまだ混乱しています。ここに一連の質問があります 1)中華レストランモデルとDPの違いは何ですか?2)無限混合モデルとDPの違いは何ですか? すべてを完全に理解するために、中華レストランモデル、Polya Urnモデル、スティック破壊を実装しました。しかし、DPを最初から実装するのは難しいことのようです。Python、R、Matlabを読み書きできます。 1)DPを完全に理解/機能/開発するために読んで改善することをお勧めするコードはありますか?2)私の調査によると、ディリクレプロセスのコードは読みやすくありませんでした。本当に長くて長い(おそらく、明快さよりも効率がより重要であったため)。3)ただし、無限混合モデルには、ディリクレプロセスよりも多くのコードがあります。これらの2つの方法が互いに遠くない場合、IMMを使用できますか?!基本的に、私は新しいモデルを構築したいのですが、車輪を作り直したくありません。 コメントありがとうございます 多くの人が「ノンパラメトリックベイとDPを使用した無限混合モデル」に関するEdwin Chenのチュートリアルを推奨しているため、更新してください。このチュートリアルには誤解を招くタイトルがあります。DP、特異度、CPR、スティック破壊、Polya-Urnモデルのさまざまな表現のみをカバーしています。そして最後に、彼はscikitのMixture Modelを使用して、各クラスターでいくつかのヒストグラムを作成しています。