私の質問は非常に簡単です:線形回帰の仮定で誤差項が従う分布として正規を選択するのはなぜですか?ユニフォーム、T、その他のようなものを選択しないのはなぜですか?
私の質問は非常に簡単です:線形回帰の仮定で誤差項が従う分布として正規を選択するのはなぜですか?ユニフォーム、T、その他のようなものを選択しないのはなぜですか?
回答:
他のエラー分布を選択します。多くの場合、かなり簡単に行うことができます。最尤推定を使用している場合、これにより損失関数が変更されます。これは確かに実際に行われます。
ラプラス(二重指数誤差)は、最小絶対偏差回帰/ 回帰(サイト上の多数の投稿で議論されています)に対応しています。Tエラーのある回帰は時折使用されますが(場合によっては、総誤差に対してより堅牢であるため)、不利な点があります-可能性(したがって損失のマイナス)には複数のモードがあります。
均一な誤差が対応損失(最大偏差を最小化します)。このような回帰は、チェビシェフ近似と呼ばれることもあります(ただし、本質的に同じ名前の別のものがあるので注意してください)。繰り返しますが、これは時々行われます(実際に線形計画法または他のアルゴリズムを使用することができますが、単純な回帰および一定の広がりを持つ境界誤差を伴う小さなデータセットの場合、フィットはしばしばプロット上で直接手で見つけるのに十分簡単です) ;実際、との回帰の問題はいくつかの問題のために、時には便利ショートカットをもたらすことができるお互いの双対)です。
実際、手作業でデータに適合させた「均一誤差」モデルの例を次に示します。
4つのマークされたポイントがアクティブセットに含まれる唯一の候補であることを(データに向かって直定規をスライドさせることにより)簡単に識別できます。それらのうち3つが実際にアクティブセットを形成します(そして、少しのチェックで、どの3つがすべてのデータを含む最も狭い帯域につながるかがすぐに識別されます)。そのバンドの中心の線(赤でマーク)は、その線の最尤推定値です。
他の多くのモデル選択が可能であり、実際にはかなりの数が使用されています。
密度がkの加法的な独立した一定の広がりのエラーがある場合は、、尤度を最大化することは最小限に対応する、ある残留番目。
ただし、最小二乗法が一般的な選択であるさまざまな理由があり、その多くは正規性の仮定を必要としません。
計算上最も便利な選択であるため、通常/ガウスの仮定がよく使用されます。回帰係数の最尤推定値の計算は、2次最小化問題であり、純粋な線形代数を使用して解決できます。ノイズ分布の他の選択は、より複雑な最適化問題をもたらし、通常は数値的に解決する必要があります。特に、問題は非凸状である可能性があり、さらに複雑になります。
一般に、正規性は必ずしも適切な仮定ではありません。正規分布のテールは非常に小さく、これにより、回帰推定値は外れ値に非常に敏感になります。ラプラスやスチューデントのt分布などの代替物は、測定データに外れ値が含まれている場合にしばしば優れています。
詳細については、Peter Huberの独創的な本Robust Statisticsを参照してください。
Glen_bは、OLS回帰を一般化できる(二乗和を最小化する代わりに尤度を最大化できる)ことをうまく説明しており、他の分布を選択しています。
しかし、なぜ正規分布はそれほど頻繁に選択されるのですか?
その理由は、正規分布は多くの場所で自然に発生するためです。自然界のさまざまな場所で黄金比やフィボナッチ数が「自然に」発生することがよくあるのと同じです。
正規分布は、有限分散を持つ変数の合計の制限分布です(または、より厳密でない制限も可能です)。そして、制限を取らずに、有限数の変数の合計の良い近似でもあります。したがって、多くの観測されたエラーは、多くの小さな観測されていないエラーの合計として発生するため、正規分布は適切な近似です。
こちらもご覧ください正規分布の重要性
GaltonのBeanマシンが直感的に原理を示す場所
他のディストリビューションを選択しないのはなぜですか?
予期せぬ損失は通常、最も賢明な損失です。
線形回帰は、上記の方程式で固定分散の正規密度を使用すると考えることができます。
これにより、重量が更新されます。
一般に、別の指数族分布を使用する場合、このモデルは一般化線形モデルと呼ばれます。異なる分布は異なる密度に対応しますが、予測、重み、およびターゲットを変更することで、より簡単に形式化できます。
私の知る限り、勾配対数正規化関数は任意の単調な分析関数であり、単調な分析関数は指数関数族の勾配対数正規化関数です。