(この回答では、指定した2番目のリンクを使用します。)
尤度の定義を思い出してください:
我々の場合にはθ = (θ A、θ B)確率の推定量であること硬貨A及びBはそれぞれランドヘッド、X = (X 1、... 、X 5)実験の結果である、各
L[θ|X]=Pr[X|θ]=∑ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,…,X5)は10回のフリップで構成され、
Z = (Z 1、… 、Z 5)
は各実験で使用されたコインです。
XiZ=(Z1,…,Z5)
私たちは、最尤推定量を見つけたいθを。期待値最大化(EM)アルゴリズム(少なくとも局所)を見つけるためにこのような方法の一つであるθを。条件付き期待値を見つけることで機能し、それを使用してθを最大化します。アイデアは
、各反復でより可能性の高い(つまり、より可能性の高い)θを継続的に見つけることにより、Pr [ X 、Z | θ ]は、尤度関数を増加させます。EMベースのアルゴリズムを設計する前に、3つのことを行う必要があります。θ^θ^θθPr[X,Z|θ]
- モデルを作成する
- モデルの下での条件付き期待値の計算(E-Step)
- θ
モデルを構築する
logPr[X,Z|θ]
logPr[X,Z|θ]=∑i=15log∑C∈{A,B}Pr[Xi,Zi=C|θ]=∑i=15log∑C∈{A,B}Pr[Zi=C|Xi,θ]⋅Pr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ]≥∑i=15∑C∈{A,B}Pr[Zi=C|Xi,θ]⋅logPr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ].
log
Pr[Zi=C|Xi,θ]CXiθ
Pr[Zi=C|Xi,θ]=Pr[Xi,Zi=C|θ]Pr[Xi|θ].
Xihi=#heads in Xi
Pr[Xi,Zi=C|θ]=12⋅θhiC(1−θC)10−hi, for C∈{A,B}.
Pr[Xi|θ]Zi=AZi=BPr[Zi=A]=Pr[Zi=B]=1/2Pr[Xi|θ]=1/2⋅(Pr[Xi|Zi=A,θ]+Pr[Xi|Zi=B,θ]).
Eステップ
θθ0=(0.6,0.5)
Pr[Z1=A|X1,θ]=1/2⋅(0.65⋅0.45)1/2⋅((0.65⋅0.45)+(0.55⋅0.55))≈0.45.
X1=(H,T,T,T,H,H,T,H,T,H)AE[#heads by coin A|X1,θ]=h1⋅Pr[Z1=A|X1,θ]=5⋅0.45≈2.2.
BE[#heads by coin B|X1,θ]=h1⋅Pr[Z1=B|X1,θ]=5⋅0.55≈2.8.
h110−h1Xihi 1≤i≤5E[#heads by coin A|X,θ]=∑i=15E[#heads by coin A|Xi,θ]
Mステップ
θ
θ1A=E[#heads over X by coin A|X,θ]E[#heads and tails over X by coin A|X,θ]=21.321.3+9.6≈0.71.
Bθ1θθ^=θ10=(0.8,0.52)Pr[X,Z|θ]θ
θ^