ベイジアン解釈は、事後分布に関連する推定量について、ベイジアン分析のフレームワーク内にのみ存在します。したがって、REML推定量にベイジアン解釈(つまり、事後から得られる推定量としての解釈)を与えることができる唯一の方法は、REML分析で制限された対数尤度を対応する対数後ベイズ分析; この場合、REML推定量は、ベイズ理論からのMAP推定量であり、対応するベイジアン解釈を備えています。
REML推定量をMAP推定量に設定する: REML分析で制限された対数尤度をBayes分析で対数事後に設定する方法を見るのは比較的簡単です。これを行うには、log-priorがREMLプロセスによって削除される対数尤度の部分の負である必要があります。我々は対数尤度があるとℓのRE(θは)残留対数尤度とあるθをℓx(θ,ν)=ℓ∗(θ,ν)+ℓRE(θ)ℓRE(θ)θは、関心のあるパラメーターです(は迷惑パラメーターです)。前に設定π (θ 、ν )α EXP (- ℓ *(θ 、νは))事後対応できます:νπ(θ,ν)∝exp(−ℓ∗(θ,ν))
π(θ|x)∝∫Lx(θ,ν)π(θ,ν)dν∝∫exp(ℓx(θ,ν))exp(−ℓ∗(θ,ν))dν=∫exp(ℓx(θ,ν)−ℓ∗(θ,ν))dν=∫exp(ℓ∗(θ,ν)+ℓRE(θ)−ℓ∗(θ,ν))dν=∫exp(ℓRE(θ))dν=∫LRE(θ)dν∝LRE(θ).
これにより、次のことができます。
θ^MAP=argmaxθπ(θ|x)=argmaxθLRE(θ)=θ^REML.
この結果により、REML推定量をMAP推定量として解釈できます。したがって、REML推定量の適切なベイジアン解釈は、上記の事前条件の下で事後密度を最大化する推定量であるということです。
REML推定量にベイジアン解釈を与える方法を説明したので、このアプローチにはいくつかの大きな問題があることに注意します。1つの問題は、データに依存する対数尤度成分を使用して事前確率が形成されることです。したがって、この解釈を得るために必要な「事前」は、データを見る前に形成できる関数であるという意味で、実際の事前ではありません。別の問題は、事前確率が不適切であることが多く(つまり、事前確率に統合されない)、パラメーター値が極端になると実際に重みが増加する可能性があることです。(この例を以下に示します。)ℓ∗(θ,ν)
これらの問題に基づいて、REML推定量に妥当なベイジアン解釈がないと主張することができます。あるいは、REML推定器は上記のベイジアン解釈を維持し、指定された形式の観測データと偶然一致する必要がある「事前」の最大事後推定器であり、非常に不適切であると主張できます。
x1,...,xn∼N(ν,1/θ)θν
ℓx(ν,θ)=−n2lnθ−θ2∑i=1n(xi−ν)2.
REMLでは、この対数尤度を2つのコンポーネントに分割しました。
ℓ∗(ν,θ)ℓRE(θ)=−n2lnθ−θ2∑i=1n(xi−ν)2=−n−12lnθ−θ2∑i=1n(xi−x¯)2.
We obtain the REML estimator for the precision parameter by maximising the residual likelihood, which gives an unbiased estimator for the variance:
1θ^REML=1n−1∑i=1n(xi−x¯)2.
In this case, the REML estimator will correspond to a MAP estimator for the "prior" density:
π(θ)∝θn/2exp(θ2∑i=1n(xi−ν)2).
As you can see, this "prior" actually depends on the observed data values, so it cannot actually be formed prior to seeing the data. Moreover, we can see that it is clearly an "improper" prior that puts more and more weight on extreme values of θ and ν. (Actually, this prior is pretty bonkers.) If by "coincidence" you were to form a prior that happened to correspond to this outcome then the REML estimator would be a MAP estimator under that prior, and hence would have a Bayesian interpretation as the estimator that maximises the posterior under that prior.