西安が言うように、問題は根拠のないものですが、それでも多くの人々は、いくつかの文献やインターネットに出てきた声明のために、ベイジアンの観点から最尤推定値を検討するように導かれていると思います: " 最尤推定は、事前分布が均一である場合のベイジアン最大事後推定の特定のケースです。
ベイジアンの観点からは、最尤推定量とその不変性特性は理にかなっていますが、ベイジアン理論における推定量の役割と意味は、頻度主義理論とは大きく異なります。そして、この特定の推定量は、通常、ベイジアンの観点からはあまり賢明ではありません。これが理由です。簡単にするために、1次元のパラメーターと1対1の変換について考えてみましょう。
まず最初に、2つの備考:
T=273.16t=0.01θ=32.01η=5.61
p(x)dx
x
Δxp(x)Δxx
dx
p(x1)>p(x2)x1x2xx1x2
xx~Dx~:=argmaxxp(D∣x).(*)
D
Dp(x∣D)dx∝p(D∣x)p(x)dx.(**)
理想的には、完全な確率分布指定して不確実性を報告する必要がありますp(x∣D)dx
(P0,P)↦G(P0;P)P0P(x0,x)↦Gx(x0;x)(y0,y)↦Gy(y0;y)y=f(x)Gx(x0;x)=Gy[f(x0);f(x)]
たとえば、二次効用関数について話すとき、特定の座標系、通常はパラメーターの自然な座標系を暗黙的に選択したことをすぐに強調しておきます。別の座標系では、効用関数の式は一般に2次ではありませんが、パラメーター多様体上の効用関数と同じです。
P^GDxx^:=argmaxx0∫Gx(x0;x)p(x∣D)dx.(***)
y=f(x)y^=f(x^)G
この種の不変性は、ベイズ推定器の組み込みプロパティであることがわかります。
今、私たちは尋ねることができます:最尤法に等しい推定量につながる効用関数はありますか?最尤推定量は不変なので、このような関数が存在する可能性があります。それがあった場合にこのような観点からは、最尤は、ビューのベイズポイントから無意味だろうではない不変!
xGx(x0;x)=δ(x0−x)(***)x^=argmaxxp(x∣D)(**)x(*)Gx(x0;x)=1|x0−x|<ϵGx(x0;x)=0ϵ→0
したがって、そうです。数学的に寛大で、一般化された関数を受け入れる場合、最尤推定量とその不変性は、ベイジアンの観点から理解できます。しかし、ベイジアンの観点における推定量のまさにその意味、役割、および使用法は、頻度主義の観点におけるものとは完全に異なります。
また、上記で定義された効用関数が数学的に意味があるかどうかについて、文献に予約があるように思われることも付け加えておきます[5]。いずれにせよ、そのような効用関数の有用性はかなり制限されています。Jaynes[3]が指摘するように、それは「正確であることの可能性のみを気にします。間違っている場合は気にしません」どれだけ間違っているのか」
y=f(x)
Gy(y0;y)=δ[f−1(y0)−f−1(y)]≡δ(y0−y)|f′[f−1(y0)]|
y
y
y
したがって、上記のステートメントは暗黙的に特別な座標系を想定しています。暫定的でより明示的なステートメントは次のようになります。「最尤推定量は、一部の座標系でデルタ効用関数と均一事前分布を持つベイズ推定量と数値的に等しい」。
最後のコメント
上記の議論は非公式ですが、測度理論とStieltjes統合を使用して正確にすることができます。
ベイジアン文献では、より非公式な推定量の概念を見つけることもできます。これは、特に完全密度を指定することが不便または不可能な場合に、確率分布を「要約」する数ですp(x∣D)dx
[1]たとえば、H。Raiffa、R。Schlaifer:Applied Statistical Decision Theory(Wiley 2000)。
[2] Y. Choquet-Bruhat、C。DeWitt-Morette、M。Dillard-Bleick:分析、多様体および物理学。パートI:基本(Elsevier 1996)、または微分幾何学に関するその他の優れた本。
[3] ETジェインズ:確率論:科学の論理(ケンブリッジ大学出版2003)、§13.10。
[4] J.-M. ベルナルド、AFスミス:ベイジアン理論(Wiley 2000)、§5.1.5。
[5] IHジャーミン:多様体の不変ベイズ推定 https://doi.org/10.1214/009053604000001273 ; R.バセット、J。デライド:ベイズ推定量の限界としての最大事後推定量 https://doi.org/10.1007/s10107-018-1241-0。
[6] KPマーフィー:機械学習:確率論的展望(MIT Press 2012)、特にchap。5.
[7] DJC MacKay:情報理論、推論、および学習アルゴリズム(Cambridge University Press 2003)、http://www.inference.phy.cam.ac.uk/mackay/itila/。