なぜパラメーターの最尤推定値を取得するのがそれほど一般的であるのに、予想尤度パラメーター推定値についてはほとんど聞いていません(つまり、尤度関数のモードではなく期待値に基づいています)。これは主に歴史的な理由によるものですか、それともより実質的な技術的または理論的な理由によるものですか?
最尤推定値ではなく予想尤度推定値を使用することには、大きな利点や欠点がありますか?
予想尤度推定が日常的に使用される領域はありますか?
なぜパラメーターの最尤推定値を取得するのがそれほど一般的であるのに、予想尤度パラメーター推定値についてはほとんど聞いていません(つまり、尤度関数のモードではなく期待値に基づいています)。これは主に歴史的な理由によるものですか、それともより実質的な技術的または理論的な理由によるものですか?
最尤推定値ではなく予想尤度推定値を使用することには、大きな利点や欠点がありますか?
予想尤度推定が日常的に使用される領域はありますか?
回答:
提案された方法(尤度を密度に正規化した後)は、モデル内のすべてのパラメーターに対してフラットな事前分布を使用し、推定値として事後分布の平均を使用してパラメーターを推定することと同等です。適切な事後分布が得られないため、フラット事前分布を使用すると問題が発生する場合があります。そのため、ここでその状況を修正する方法がわかりません。
ただし、ほとんどのコンテキストでは尤度は確率密度を構成せず、ランダムなものは何も残っていないため、この方法はあまり意味がありません。これは、推定値を取得するために事後の尤度に適用する操作としてこれを定式化することができますが、この推定器の頻度特性がどのように見えるかわかりません(推定値が実際に存在する場合)。
利点:
短所:
理由の1つは、最尤推定が簡単だということです。パラメーターに対する尤度の導関数をゼロに設定し、パラメーターを解きます。期待値を取得するということは、各パラメーターに尤度を掛けることを意味します。
もう1つの理由は、指数族では、最尤推定が期待値の取得に対応することです。たとえば、データポイント を近似する最尤正規分布は、平均と2次モーメント持ちます。
場合によっては、最尤パラメーターは期待尤度パラメーターと同じです。たとえば、上記の正規分布の期待尤度平均は、平均の事前分布が正規であり、正規分布の最頻値と平均が一致するため、最尤と同じです。もちろん、それは他のパラメーターには当てはまりません(ただし、パラメーター化する必要があります)。
最も重要な理由はおそらく、パラメーターの期待が必要な理由でしょうか?通常、モデルを学習していて、パラメーター値だけで十分です。単一の値を返す場合、返される可能性が最高ではないでしょうか?
このアプローチは存在し、最小コントラスト推定量と呼ばれます。関連論文の例(および内部からの他の参照を参照) https://arxiv.org/abs/0901.0655