制限付き最尤法が分散のより良い(バイアスされていない)推定値をもたらすのはなぜですか?


11

Rのlme4パッケージに関するDoug Batesの理論の論文を読んで、混合モデルの要点をよりよく理解し、制限付き最尤(REML)を使用して分散を推定することについて、より理解したい興味深い結果に出会いました。

REML基準のセクション3.3で、分散推定におけるREMLの使用は、近似線形モデルの残差から分散を推定するときの自由度補正の使用と密接に関連していると述べています。特に、「通常はこの方法で導出されることはありませんが」、「REML基準」の最適化を通じて分散を推定することにより、自由度補正を導出できます(式(28))。REML基準は基本的には尤度だけですが、線形フィットパラメーターは、(バイアスされたサンプル分散を与えるフィット推定に等しく設定する代わりに)マージナライズすることで削除されました。

私は計算を行い、固定効果のみの単純な線形モデルに対して主張された結果検証しました。私が苦労しているのは解釈です。適合パラメーターが取り除かれた可能性を最適化することによって分散推定値を導き出すことが自然であるいくつかの視点がありますか?確率を事後として考え、フィット変数をランダム変数であるかのように取り除いているかのように、それはベイジアンのような感じです。

それとも正当化は主に数学的なものですか?それは線形の場合に機能しますが、一般化も可能ですか?

回答:


4

分散のバイアスは、平均がデータから推定されたため、「この推定平均の周りのそのデータの広がり」(つまり、分散)が「真の」平均の周りのデータの広がりよりも小さいという事実から生じます。参照:標準偏差を計算するときにで割る直感的な説明?n1

固定効果はモデルの「平均値」を決定するため、データから平均値を推定せずに導出された分散推定値を見つけることができる場合(「固定効果(つまり平均値)を周辺化することによって」)、この広がり(つまり、分散)は軽減されます。

これは、REMLの推定がバイアスを排除する理由を「直感的に」理解することです。「推定平均」を使用せずに分散の推定を見つけます。


1

著者David DickeyによるこのSAS関連リソース内の付録:REML推定方法を確認してください。

" 既知の平均値が0であり、平方和と理論分散がn個のY値と同じである(n-1)個のZを常に見つけることができます。これにより、Z平方和をZの数(n)で除算する動機が生まれます。 -1。 "

私が大学院にいたとき、REMLはスライスされたパン以来の最高のものになるように作られました。lme4パッケージを調査したところ、実際にはそれほど一般化されておらず、大規模な計画ではそれほど重要ではないことがわかりました。


たぶん...興味深い数学と統計のビットですが。
Paul

私はポールに同意します。REMLは、Statisticsにおけるエレガントで創造的な問題解決の素晴らしい例だと思います。それは確かに実際に使用され始めており、おそらくそれが統計調査で期待できるすべてのことです。
Ben Ogorek
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.