言われているエラーが等分散性で連続的に相関がない場合、yの通常の最小二乗(OLS)は線形不偏推定量のクラスで最適です。等分散残差に関して、残差の分散は、x軸上の残差の大きさの変化をどこで測定するかに関係なく、同じです。たとえば、測定値の誤差がy値の増加に比例して増加するとします。次に、回帰を実行する前に、それらのy値の対数をとることができます。これを行うと、対数を取ることなく比例誤差モデルをフィッティングする場合と比較して、フィッティングの品質が向上します。一般に、等分散性を得るには、y軸またはx軸のデータ、対数、平方根または平方根の逆数を取るか、指数関数を適用する必要があります。これの代わりに、重み付け関数を使用することもできます。(y−モデル)2(y−model)2y2は、最小化するよりもうまく機能します。(y−model)2
そのことを言ったとしても、残差をより均一にすることは、それらをより正規分布にすることはしばしば起こりますが、しばしば、均一特性がより重要です。後者は、回帰を実行する理由によって異なります。たとえば、データの平方根が対数を取るよりも正規分布しているが、誤差が比例型である場合、対数のt検定は、母集団または測定値の違いを検出するのに役立ちますが、期待される結果を見つけるのに役立ちます。値データの平方根のみを使用する必要があります。これは、データの平方根のみが対称分布であるため、平均、モード、中央値が等しいことが期待されるためです。
さらに、y軸の値の最小予測誤差を与える答えを望まないことがよくあります。これらの回帰には大きな偏りがある可能性があります。たとえば、xのエラーを最小化するために後退したい場合があります。あるいは、yとxの関係を明らかにしたい場合もありますが、これは通常の回帰問題ではありません。次に、xとyの最小エラー回帰の間の最も単純な妥協点として、Theil、つまり中央勾配、回帰を使用します。または、反復測定の分散がxとyの両方について何であるかがわかっている場合、デミング回帰を使用できます。通常の回帰結果に対してひどいことをする異常値がはるかに大きい場合、それらの回帰はより優れています。また、中央値勾配回帰では、残差が正規分布しているかどうかはほとんど問題になりません。
ところで、残差の正規性は、必ずしも有用な線形回帰情報を提供するわけではありません。たとえば、2つの独立した測定を繰り返し測定するとします。独立性があるため、予想される相関はゼロであり、回帰直線の傾きは、有用な傾きのない任意の乱数になります。位置の推定値、つまり平均(または中央値(1つのピークを持つコーシーまたはベータ分布)または最も一般的には母集団の期待値)を確立するために測定を繰り返し、そこからxの分散と分散を計算しますyで、デミング回帰などに使用できます。さらに、元の母集団が正常である場合、重ね合わせが同じ平均で正常であるという仮定は、有用な線形回帰を引き起こさない。これをさらに進めるには、次に、初期パラメーターを変更して、異なるモンテカルロxおよびy値関数生成ロケーションで新しい測定を確立し、そのデータを最初の実行と照合するとします。次に、残差はすべてのx値でy方向に正常ですが、x方向では、ヒストグラムに2つのピークがあり、OLSの仮定と一致しません。 x軸に等間隔のデータがありません。ただし、照合されたデータの回帰には明確な勾配と切片が含まれるようになりましたが、以前はそうではありませんでした。さらに、実際には繰り返しサンプリングで2点のみをテストしているため、直線性をテストすることはできません。実際、同じ理由で相関係数は信頼できる測定にはなりません。
逆に、エラーはリグレッサを条件とする正規分布であるとさらに想定される場合があります。この仮定はOLSメソッドの有効性には必要ありませんが、特定の追加の有限サンプルプロパティが確立された場合(特に、仮説テストの領域で)確立できますが、ここを参照してください。では、いつOLSは正しい回帰ですか?たとえば、毎日の終値の株価を正確に同時に測定する場合、t軸(x軸と考える)の分散はありません。ただし、最後の取引(決済)の時間はランダムに分散され、変数間の関係を発見する回帰は両方の分散を組み込む必要があります。そのような状況では、yのOLSはy値の最小の誤差のみを推定します。これは、決済の時間自体も予測する必要があるため、決済の取引価格を推定するのに適さない選択肢です。さらに、正規分布誤差はガンマ価格モデルよりも劣る場合があります。
どうしたの?まあ、一部の株は毎分数回取引され、他の株は毎日または毎週さえ取引されないため、かなり大きな数値の違いを生む可能性があります。したがって、それは私たちが望む情報に依存します。明日の取引終了時に市場がどのように振る舞うかを尋ねたい場合、これはOLSの「タイプ」の質問ですが、答えは非線形の非正規残差である可能性があり、外挿の正しい曲率を確立するために、微分フィット(および/またはより高いモーメント)と一致する形状係数を持つフィット関数が必要です。(たとえば、3次スプラインを使用して、関数だけでなくデリバティブも当てはめることができるため、めったに探索されない場合でも、デリバティブ合意の概念は驚くべきものではありません。)お金を稼ぐかどうかを知りたい場合特定の株式では、問題は二変量であるため、OLSを使用しません。