サンプルサイズが大きい場合、クラッターの問題はなぜ扱いにくいのですか?


13

ポイントのセットます。各点y iは、分布p y i | x = 1を使用して生成されます y={y1,y2,,yN}yixの 事後を取得するには、px|ypy|xpx=px N i=1pyi|xと書き ます。期待伝播 に関するミンカの論文によれば、事後分布を得るには2Nの計算が必要です。

p(yi|x)=12N(x,1)+12N(0,10).
x
p(x|y)p(y|x)p(x)=p(x)i=1Np(yi|x).
2Nであるため、大きなサンプルサイズ Nの場合、問題は扱いにくいものになります。ただし、単一の y i尤度の形式は p y i | x = 1であるため、この場合、このような量の計算が必要な理由はわかりません。p(x|y)Nyi
p(yi|x)=122π(exp{12(yix)2}+110exp{120yi2}).

この式を使用して、単純な乗算により事後を取得します。したがって、N個の演算のみが必要です。p(yi|x)N

比較する数値実験を行い、各項を個別に計算し、各密度の積を使用する場合に、同じ事後値を実際に取得します。事後も同じです。参照してください 私は間違ってどこですか?誰でも、与えられたxとサンプルyの事後を計算するために2 N演算が必要な理由を明確にできますか?yiここに画像の説明を入力してください2Nxy


1つの用語と用語ごとに1つの操作なので、O N 操作が必要です。また、私はミンカの論文とビショップの概算推論に関する章をもう一度調べます。どちらも、推定が必要であり、xの事後を取得することを示唆しています。NO(N)x
アレクセイ・ザイツェフ

yiO(nlog(n))n
user603

1
2Nx2Nます。

1
@Procrastinatorは、信念の伝播を使用したいが、混合を進める必要があるため使用できません。2Nガウス。質問は、なぜBPを使用するのかということです。BishopのPRMLの10.7.1章を読んだり、Minkaのビデオレクチャーを視聴したりする場合、別の疑問が生じます。その後、答えはこれほど明確ではありません。
アレクセイ・ザイツェフ

1
N2NxNx

回答:



2

yip(yi|x)1wpc(y)yxw

cii0p(y|x)x

存在です2N問題を引き起こすのは、これらのインジケーター変数可能なジョイント状態。


cix2N

c

cici

2N

O(n)O(2n)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.