どのように?
最近、最尤推定量とベイジアン統計について読み始めました。統計モデルが与えられた場合、は大きなパラメーター空間に属し、と間のKL発散(は真見つけたいパラメーター)は、を最大化するに対して最小化されます。イベントが独立して同一に分布していると仮定すると、これは、結合確率を最大化することになり(X,(Pθ))(X,(Pθ))(X, (P_\theta))θθ\thetaΘΘ\ThetaPθPθP_\thetaPθ∗Pθ∗P_\theta*θ∗θ∗\theta^*θθ\theta∏ni=1pθ(Xi)∏i=1npθ(Xi)\prod_{i=1}^{n}p_\theta(X_i)P[X1=x1,X2=x2,...,Xn=xn].P[X1=x1,X2=x2,...,Xn=xn].P[X_1=x_1, X_2=x_2, ...,X_n=x_n]. (独立性の仮定により、これを個々の要素の積と同等と見なすことができます) ベイズアプローチは、分布の事前信念を占め、と最大にベイズ規則により、最大限に相当し、。ここまではわかった。この後、は「可能性」と呼ばれ、に置き換えられこれは、個々の確率の積です流通におけるXの。これは、が実際に、つまり、与えられた確率であることを意味しますかθθ\thetaP(θ)P(θ)P(\theta)P(θ|X)P(θ|X)P(\theta|X)P(X|θ)P(θ)/P(X)P(X|θ)P(θ)/P(X)P(X|\theta)P(\theta)/P(X)P(X|θ)P(X|θ)P(X|\theta)P[X1=x1,X2=x2,...,Xn=xn]P[X1=x1,X2=x2,...,Xn=xn]P[X_1=x_1, X_2=x_2, ...,X_n=x_n]PθPθP_\thetaP[X1=x1,X2=x2,...,Xn=xn]P[X1=x1,X2=x2,...,Xn=xn]P[X_1=x_1, X_2=x_2, ...,X_n=x_n]Pθ[X1=x1,X2=x2,...,Xn=xn]Pθ[X1=x1,X2=x2,...,Xn=xn]P_\theta[X_1=x_1, X_2=x_2, ...,X_n=x_n]θθ\theta、またはそのようなもの? 私は確率と分布があまり得意ではありません。私の理解では、オブジェクトは条件付き確率と呼ばれ、オブジェクト(独立性によって等しい)は結合確率と呼ばれ、非常に異なるものです。著者がを最大確率での同時確率に使用する場合があるのを見てきました。結合確率と条件付き確率が等しいと見なされるのはなぜですか。P(X|θ)P(X|θ)P(X|\theta)P[X1=x1,X2=x2,...,Xn=xn]P[X1=x1,X2=x2,...,Xn=xn]P[X_1=x_1, X_2=x_2, ...,X_n=x_n]∏ni=1pθ(Xi)∏i=1npθ(Xi)\prod_{i=1}^{n}p_\theta(X_i)P(X;θ)P(X;θ)P(X;\theta)