エラーのあるデータに最適な線形回帰モデル


9

独立変数(x)に一定の測定誤差があり、従属変数(y)に信号依存誤差があるデータに最適な線形回帰アルゴリズムを探しています。

ここに画像の説明を入力してください

上の画像は私の質問を示しています。


1
定数変数xに一定の測定エラーがあり、エラーが変数の相対的な重み付けにのみ使用されている場合、この状況はxにエラーがないことと同等ではありませんか?
ペドロフィゲイラ2014年

2
エラーので、そうではない@pedro単に式における重みありません。変数内エラー回帰では、近似が異なり、パラメーターの共分散推定が通常の回帰と異なります。x
whuber

1
説明していただきありがとうございます。なぜそうなのか、少し詳しく説明してください。
ペドロフィゲイラ2014年

回答:


2

従属変数の測定エラー

一般的な線形モデル が homosckedasticであり、独立変数と自己相関および非相関ではない場合、は「真の」変数を表し、その観察可能な尺度。測定誤差は、それらの差として定義される したがって、見積モデルである: 以来あります観察された場合、OLSによってモデルを推定できます。の測定誤差が各説明変数から統計的に独立している場合、

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xky(e+ε)と同じプロパティを共有し、通常のOLS推論手順(統計など)が有効です。ただし、あなたのケースでは、分散が増えることを期待しています。あなたは使うことができます:εte
  • 重み付き最小二乗推定量(例:Kutner et al。、§11.1; Verbeek、§4.3.1-3);

  • OLS推定量。これは、まだ偏りがなく一貫しており、不均一性が一貫した標準エラー、または単にWite標準エラー(Verbeek、§4.3.4)です。

独立変数の測定誤差

上記と同じ線形モデルをとして、は「真」の値を示し、その観測可能な測定値を示します。測定エラーは次のとおりです 2つの主な状況があります(Wooldridge、§4.4.2)。xkxk

ek=xkxk
  • Cov(xk,ek)=0:測定誤差は観測された測定値と相関がないため、観測されていない変数と相関させる必要があります。書き込み及び(1)には、この目封止: 以来及びの両方各々と無相関である含む、、測定だけエラーの分散を増やし、OLSの仮定に違反しません。xkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • Cov(xk,ηk)=0:測定誤差は、観測されていない変数とは無相関であるため、観測された測度と相関させる必要があります。このような相関関係は問題を引き起こし、でののOLS回帰は一般に偏りがあり、一貫性のない推定量を与えます。xkyx1,,xk

プロット(独立変数の「真の」値を中心としたエラー)を見て推測できる限り、最初のシナリオが当てはまります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.