タイトルはそれをすべて言います。モデルのエラーが正規分布している場合、最小二乗と最大尤度は回帰係数に対して同じ結果になることを理解しています。しかし、エラーが正常に分布していない場合はどうなりますか?なぜ2つの方法が同等ではなくなったのですか?
タイトルはそれをすべて言います。モデルのエラーが正規分布している場合、最小二乗と最大尤度は回帰係数に対して同じ結果になることを理解しています。しかし、エラーが正常に分布していない場合はどうなりますか?なぜ2つの方法が同等ではなくなったのですか?
回答:
多変量ガウス分布の確率密度は、分散型変数の平均と、の二乗に関連しています(平均値と変数との間のユークリッド距離、つまり二乗和で)。
誤差に対して複数のガウス分布を乗算すると、偏差が等しいと仮定すると、二乗和が得られます。
または便利な対数形式:
したがって、を最適化して二乗和を最小化することは、(対数)尤度(つまり、複数のガウス分布の積、または多変量ガウス分布の積)を最大化することと同じです。
それは違い、このネストされた正方形であり内部指数構造、、他のディストリビューションが持っていません。
たとえば、ポアソン分布の場合と比較してください
これは、以下が最小化されたときに最大になります。
これは別の獣です。
正規分布の履歴(deMoivreが二項分布の近似としてこの分布に到達することを無視)は、実際にはMLEを最小二乗法に対応させる分布の発見と同じです(最小二乗法はメソッドではありません)正規分布のMLEを表すことができます。最初に最小二乗法、2番目にガウス分布が使用されます)
「最尤法」と「最小二乗法」を結びつけるガウスは、「ガウス分布」、を生み出しました。 2つの方法。
チャールズヘンリーデイビスの翻訳(円錐形のセクションで太陽の周りを移動する天体の運動の理論。ガウスの「セオリアモータス」の翻訳、付録付き)...
ガウスは以下を定義します:
したがって、確率各エラーに割り当てるの関数で表現される我々はによって意味するもの。
(私が行った斜体化)
そして続けます(177ページの258ページ):
...それは容易に推察されるそこそのは一定量でなければなりません。これを表します。したがって、我々が持っている
によって双曲線対数の底を表すと仮定
最終的に(正規化してを実現した後)
StackExchangeStrikeによって書かれた
MLEは、正規分布する残差の仮定から導出されるためです。
ご了承ください
確率的な意味はありません。二乗損失関数を最小化するを見つけてください。すべてが確定的であり、ランダムなコンポーネントはありません。
確率と尤度の概念が来るところは、
ここで、を確率変数と見なし、は正規分布です。ϵ
具体的な例:単純なエラー関数p(1)=。9、p(-9)= .10を取るとします。2つのポイントを取る場合、LSはそれらのポイントを通過します。一方、MLは、両方のポイントが1ユニット高すぎると想定しているため、ユニット上でシフトされたポイントを通る直線になります。