一部のパラメーターの代わりにいくつかの第1段階の推定値を代入すると、MLEで何が問題になる可能性がありますか？

最初に対数尤度関数を扱っているとします。ここで、。 $\log L(\theta_1, \ldots, \theta_m, \theta_{m+1}, \ldots, \theta_k)$ $\theta_j \in \mathbb{R}$

何らかの理由で、いくつかの第1段階の推定値、、他の方法で取得して最大化することにしたと仮定しを超える、、。すべての、、は、真のパラメーター値、、。 $\log L$ $\tilde{\theta}_{m+1}$ $\ldots$ $\tilde{\theta}_k$ $\log L$ $\theta_1$ $\ldots$ $\theta_m$ $\tilde{\theta}_{m+1}$ $\ldots$ $\tilde{\theta}_k$ $\theta_{0,m+1}$ $\ldots$ $\theta_{0,k}$

私の質問は、この場合、MLEで何が問題になるのでしょうか？MLE推定器、、は、以前と同じ漸近特性を持っていますか？、、の収束率に依存しますか？ $\hat{\theta}_1$ $\ldots$ $\hat{\theta}_m$ $\tilde{\theta}_{m+1}$ $\ldots$ $\tilde{\theta}_k$

estimation maximum-likelihood asymptotics

— アリク
ソース

良い質問。私はこのカテゴリーに入る何かに取り組んでいます。このようなことを「プラグインの可能性」と呼んでいると思いますが、どのような答えが得られるのか興味があります。このペーパーは関連性があると思います：sciencedirect.com/science/article/pii/S0304414913000811

— gammer

あなたの手法は、基本的に条件とする条件付き対数尤度を最大化すること。完全な最大対数尤度は、他のすべてのパラメーターにおけるこの条件付き最大値の最大値です。これは、特にで条件付きパラメーターが1つしかない場合に、尤度スキャンを生成するために非常に頻繁に使用されます。関数としての最大対数尤度は、信頼区間を設定するのにます。 $\tilde \theta_{m+1},\ldots,\tilde \theta_k$ $k=m+1$ $\tilde \theta_k$ $\theta_k$

哲学的には、それは常に固定されている条件パラメータがあること場合-あなたは常にあなたのモデルに追加パラメータを追加することができます。すべての尤度関数は条件付き尤度関数であり、その逆も同様です。条件付き対数尤度関数の最大化には、尤度関数の最大化から期待できるすべての統計的特性があります。唯一の違いは、最大化の背後にある仮定を扱って、本質的に非統計的です。たとえば、モデルを単純化することはどれほど合理的ですか？通常、正確な値があることを知りたい場合があります。 $\tilde \theta_k$ 、または特定の値を持つためのドメイン固有の（非統計的）引数があること。たとえば、OLS（尤度最大化の一種）では、誤差は対称的でガウスであり、説明変数（たとえば、非ヘテロスケスティック）とは無関係であると想定されます。歪度、非ガウス性、ヘテロスケダシティのパラメーターをいつでも追加できますが、これはしばしば不要であると判断されます。*

あなたのケースでは、信頼区間のある統計的な推定値があります。重要な問題は、推定値が尤度最大化中に使用されたのと同じデータから取得されたものか、独立したデータセットから取得されたものかです。後者の場合、非常に一般的な手順を実行しています。あなたは不確実性から伝播するように試みることができる一つのアドホック手順、あなたの最終的な結果には、あなたのサンプリングすることができ $\tilde \theta$ $\tilde \theta$ ある種のパラメトリックブートストラップの信頼区間内から、各サンプルの条件付き対数尤度を最大化し、信頼区間を拡張します。別の手法は、パラメーターを対数尤度で浮動させ、信頼区間の制約項を追加することです。たとえば、関連性のない定数を無視して、尤度にガウスpdfします。 $\exp(-(\theta_k-\tilde \theta_k)^2/2\sigma_k^2)$

一方、推定が尤度最大化で使用されたのと同じデータを使用して作成されている場合、より疑わしい手順になります。のセットを固定された条件として使用すると、条件付き対数尤度最大化は統計的に有効ですが、信頼区間が適切に機能するとは限りません。パラメータを同じデータセットで二重にペナルティ化するため、尤度に制約条件を追加する、またはパラメータをパラメータでサンプリングする上記の手順は無効です。スキャンできます $\tilde \theta$ $\tilde \theta$ $\tilde \theta$ $\tilde \theta_{m+1},\ldots,\tilde \theta_k$ 、妥当な信頼区間をカバーするグリッド内。これが単に対数尤度全体を最大化するよりも良い/簡単かどうかを判断できるのはあなただけです。

ノート

おそらく最良の例ではありません。通常、OLS回帰の診断プロット/残差を調べて、これらのことを確認することをお勧めします。私が思いつくことができるより良い例はドメイン固有です。

— jwimberley
ソース