共分散のガウスの混合物のためのEMアルゴリズムの限界ケースとしてK-手段に行く


8

私の目標は、K平均アルゴリズムが実際にガウス混合の期待値最大化アルゴリズムであり、すべての成分がの範囲の共分散を確認することです。σ2Ilimσ0

確率変数Xの観測のデータセット{x1,,xN}があるとします。 M平均の目的関数は、 J = \ sum_ {n = 1} ^ {N} \ sum_ {k = 1} ^ {K} r_ {nk} || x_n-\ mu_k || ^ 2与えられますr_ {nk}は、クラスターkへのx_nのハード割り当てのバイナリインジケーター変数です。 (データポイントx_nがクラスターkに割り当てられている場合、j \ ne kに対してr_ {nk} = 1およびr_ {nj} = 0)。 K平均アルゴリズムは、収束するまで反復によってJを最小化します。これには、2つの連続するステップが含まれます。 (E)最小化X

J=n=1Nk=1Krnk||xnμk||2
rnkxnk
xnkrnk=1rnj=0j
J
Jに対して{rnk}n,kのすべてを維持μk固定
最小(M)をJに対して、{μk}k全て維持rnk固定

一般に、すべての観測データをX、すべての潜在変数をZ、すべてのモデルパラメーターのセットを\ thetaで表すθと、EMアルゴリズムは2つの交互のステップの収束まで反復により事後分布p(θ|X)を最大化します:
(E )期待値を計算するQ(θ,θold):=Zp(Z|X,θold)logp(Z,X|θ)
(M)検索θnew=argmaxθQ(θ,θold)

次に、ガウス混合分布を考えます 潜在的な次元のバイナリ確率変数を、次のことがわかります: したがって

p(x)=k=1KπkN(x|μk,Σk)
Kzp(zk=1)=πk
p(X,Z)=n=1Nk=1KπkznkN(xn|μk,Σk)znk
γ(zk):=p(zk=1|x)=πkN(x|μk,Σk)j=1KπjN(x|μj,Σj)
logp(X,Z|μ,Σ,π)=n=1Nk=1Kznk(logπk+logN(xn|μk,Σk))
E(znk)=γ(znk)
Q((π,μ,Σ),(π,μ,Σ)old)=n=1Nk=1Kγ(znk)(logπk+logN(xn|μk,Σk))

混合モデル内のすべてのガウス分布が共分散持っている場合、極限を考慮すると、であることがここで、は上記で定義。したがって、実際には(E)ステップは、K平均アルゴリズムと同様にを更新します。σ2Iσ0γ(znk)rnkrnkrnk

しかし、私はこのコンテキストでを最大化することに問題があり。 いくつかの定数およびスカラー乗算まで、それは本当ですか: ?Q((π,μ,Σ),(π,μ,Σ)old)xμ limσ0log(N(x|μ,σ2))=
limσ0Q((π,μ,Σ),(π,μ,Σ)old)=J

多分私は何かが欠けています。何かアドバイス?


2
@Andrzejのサイトへようこそ。質問全体を投稿してください。他の人があなたの本を探しに行くと言ってはいけません。
StasK 2014年

1
親愛なるStasK様、私は質問全体を投稿しました。
Andrzej Neugebauer 2014年

回答:


3

いくつかの定数およびスカラー倍まで: ?limσ0Q((π,μ,Σ),(π,μ,Σ)old)=J

これは、あなたが観察したように、限界が分かれているため、そうではありません。

ただし、最初にを変換し、その後、極限をとる場合、k平均の目的に収束します。と我々は持っていますQΣk=σ2Iπk=1/K

Q=n,kγnk(logπk+logN(xnμk,Σk))=Nlog1K1σ2n,kγnk||xnμk||2ND2log2πσ2.

乗じる(EMアルゴリズムに影響を及ぼさない、ため最適化が、一定ではない)およびすべての定数項収集、我々は参照 に対してこの関数を最大化することに注意任意ためおよび同じを与えます上記の目的関数としての結果、つまり、Mステップの同等の定式化です。ただし、制限を適用するとます。σ2σC

Qn,kγnk||xnμk||2+σ2C.
μγσJ

余談ですが、私の考えでは、EMのもう少しエレガントな定式化は、目的関数 この目的関数を使用すると、EMアルゴリズムは交互になります(Mステップ)と(E ステップ)に関する最適化の間。限界を取ると、MステップとEステップの両方がk平均アルゴリズムに収束することがわかります。

F(μ,γ)=n,kγnklogπkN(xnμk,Σk)/γnkn,kn,kγnk||xnμk||2σ2n,kγnklogγnk+σ2C.
Fμγ

EMの別のビューも参照してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.