2
最大尤度は再パラメーター化不変ではありません。それで、どうやってそれを使うのが正当化できるのでしょうか?
max-likelihood推定量について私を混乱させる何かがあります。私がいくつかのデータとパラメータの下の可能性を持っていると仮定しますμμ\mu です L(D|μ)=e−(.7−μ)2L(D|μ)=e−(.7−μ)2 L(D|\mu) = e^{-(.7-\mu)^2} これは、スケーリングまでのガウスの可能性として認識できます。今私の最尤推定量は私にくれますμ=.7μ=.7\mu=.7。 今、私はそれを知らず、代わりにパラメータを操作していたとしましょう ttt そのような μ=sin(t)μ=sin(t)\mu=\sin(t)。また、これはすべて数値であり、次の可能性がどのように愚かに見えるかはすぐにはわかりません。 L(D|t)=e−(.7−sin(t))2L(D|t)=e−(.7−sin(t))2 L(D|t) = e^{-(.7-\sin(t))^2} 今、私は最大の可能性を解決し、追加のソリューションを取得します。これを確認するために、以下にプロットします。 したがって、この観点からすると、max-likelihood は再パラメーター化不変ではないため、愚かなことのように思えます。何が欠けていますか? 可能性は常に測度とともに来るため、ベイズ分析は当然これを処理します。 L(D|μ)P(μ)dμ=L(D|μ(t))P(μ(t))dμdtdtL(D|μ)P(μ)dμ=L(D|μ(t))P(μ(t))dμdtdt L(D|\mu) P(\mu) d\mu = L(D|\mu(t)) P(\mu(t)) \frac{d\mu}{dt} dt 応答とコメントの後に部分を追加(2018年3月16日に追加) 上の2つの最大値が t1,t2t1,t2t_1,t_2 対応する .7=sin(t1)=sin(t2).7=sin(t1)=sin(t2).7=\sin(t_1)=\sin(t_2)。彼らは同じ点を特定しています。以下の議論と回答が意味をなすように、私は上記を守りました。しかし、私が理解しようとしている問題のより良い例を以下に示します。 取る L(D|μ)=e−(a−μ)2L(D|μ)=e−(a−μ)2 L(D|\mu) = e^{-(a-\mu)^2} ここで、パラメータを再設定するとします μ=μ(t)μ=μ(t)\mu=\mu(t) 次に、最大尤度を行います ttt 私は得る ∂L∂t=∂L∂μ∂μ∂t∂L∂t=∂L∂μ∂μ∂t \frac{\partial L}{\partial t} = \frac{\partial L}{\partial …