ディリクレ過程がベイズのノンパラメトリックのアプリケーションに適さないのはなぜですか?


8

DPの離散的な性質は、ベイジアンノンパラメトリックスの一般的なアプリケーションには適していませんが、混合モデリングで混合コンポーネントに優先順位を付ける問題に適しています。

この引用は、階層的ディリクレプロセス(Teh、et al、(2006)[ 1 ])からのものであり、それが何を意味するかについての説明を探していました。ベイジアンノンパラメトリックスは、著者が何を参照しているかを理解するのに私にはあいまいすぎる用語のようです。[1]

Teh、YW、Jordan、MI、Beal、MJ、Blei、DM(2006):「階層的ディリクレプロセス」。Journal of the American Statistical Association、101、pp。1566–1581。[1]


2
「離散的」な記述とは、ディリクレプロセスからの描画が確率1で離散的であるという事実を指していると思います(DPのスティックブレーキングの表現から派生します)。
ankit 2013年

詳しく説明する必要があります。スティックを何らかの方法で個に分割すると、スティックの長さの分布は連続的です。k
Glen_b-2013

@Glen_b:あなたの直感は私のものと一致しますが、リンクされた紙のキットは「DPから引き出されるものは離散的です(確率1)」と述べています。私は彼らの議論には従えませんが、著者を尊重します。
David J. Harris

@ DavidJ.Harrisはい、それについて読んで、それは-「プロセス」という言葉がより一般的に分布に関連付けられている方法と矛盾しています-「多項式プロセス」または「多項式」のようなものを私が呼んでいたものを参照しているようです出力はカテゴリなので、「混合」。(この命名スキームは、イベント数を通常のようにカウントするのではなく、イベント間時間を「ポアソンプロセス」と呼ぶようなものです。あるいは、ベルヌーイプロセスを「ベータプロセス」と呼ぶかもしれません。ベルヌーイ確率に関する事前ベータがあったため。)
Glen_b-モニカを

「数え切れないほどの」実数の数が実数の代表であると考えるかどうかによって異なります。私はそれがそうであると思っていたので、上記の主張に反対する議論を提供します。
probabilityislogic

回答:


4

確率1では、ディリクレプロセスの実現は離散確率測度です。厳密な証明は、

ブラックウェル、D。(1973)。「ファーガソン選択の離散性」、統計学年報、1(2):356–358。

ディリクレ過程のスティック破壊表現は、この特性を透明にします。

  1. BBeta1c1

  2. P1=B1P=BΠj=111Bj>1

  3. YF1

  4. Gtω=Σ=1Pω[Yωt
    cF

Fバツ1バツ

元の質問については、単純なディリクレプロセスは、ベイジアン密度推定の問題など、ベイジアンノンパラメトリックのいくつかの問題のモデル化には適さない可能性がありますが、これらのケースを処理するためにディリクレプロセスの適切な拡張を利用できます


離散分布で密度を推定するのはなぜ悪いのですか?これは、直角位相も悪く、不適切であることを意味しますか?
確率

「悪い」とは言わなかった。ただし、ランダム密度の滑らかさに関する事前の情報が十分にあるとします。プレーンなDPでモデリングしている場合、この以前の情報は使用できません。そういうことを考えています。
Zen

私は同意しません-平滑度は、濃度パラメーターの選択とベース分布の形状によって制御できます。
probabilityislogic

元のDPを使用してモデル化している場合、ベースメジャーを使用すると、事後分布はルベーグ測度に関して密度を持つことはありません。

あなたは密度と滑らかさを混同しています-離散分布にも密度はありませんが、それが滑らかではないという意味ではありません-例えば、n largeのbinomial(n、p)は基本的に通常と同じくらい滑らかですPDF
確率
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.