「単純な」測定誤差モデルをフィッティングする方法


13

「OLS」測定誤差モデルの推定に使用できる方法を探しています。

yi=Yi+ey,i
xi=Xi+ex,i
Yi=α+βXi

エラーは、未知の分散および独立した標準です。この場合、「標準」OLSは機能しません。σy2σx2

ウィキペディアには魅力のない解決策がいくつかあります。2つは、「分散比」または信頼性比」は既知であり、は、真のリグレッサー分散です。私はこれに満足していません。なぜなら、分散を知らない人はどうして自分の比率を知ることができるのでしょうか?δ=σy2σx2λ=σX2σx2+σX2σX2Xi

とにかく、パラメータについて「知る」必要のないこれら2つ以外のソリューションはありますか?

インターセプトとスロープのみのソリューションは問題ありません。


ウィキペディアの記事自体に、この質問に対する答えが記載されています。「真の」リグレッサーの正規性を仮定する場合、エラーの分布に関するさらなる条件が必要です。真のリグレッサーがガウス分布ではない場合、希望があります。Reiersol(1950)を参照してください。
枢機

また、「切片と勾配だけの解決策は問題ありません」とはどういう意味ですか。これらは2つだけのパラメーターです!または、「真の」リグレッサーもバックアウトしようと思っていましたか?
枢機:

@cardinal-2つのスケールパラメーター、およびあなたが言うように「真の」リグレッサーについては特に気にしなかったことを意味します。Xi
確率論的

そうですか。それは理にかなっている。
枢機

回答:


7

JW Gillardが、両方の変数にエラーがある線形回帰の歴史的概要で説明されているさまざまな可能性があります。

あなたが別の上に1つの方法を選択するための詳細や理由の中で興味を持っていない場合は、単に重心を通る線を描くことである、最も単純で行くの傾きを有するβ = S Y / のx、すなわち観測された標準偏差の比(勾配の符号をxyの共分散の符号と同じにする); あなたはおそらく出て働くことができるように、これは上のインターセプトを与えるYの-axis α = ˉ Y - β ˉ X(x¯,y¯)β^=sy/sxxyyα^=y¯β^x¯.

この特定のアプローチのメリットは次のとおりです。

  1. それは比較同一のラインを与えるに対するYのようにYに対するXxyyx
  2. スケール不変なので、ユニットについて心配する必要はありません。
  3. それは2つの通常の線形回帰線の間にあります
  4. 観測の重心で互いに交差する場所で交差します。
  5. 計算は非常に簡単です。

勾配は、2つの通常の線形回帰勾配の勾配の幾何平均です。また、yの観測を標準化し、45°(または負の相関がある場合は135°)で線を引き、線の標準化を解除した場合にも得られます。また、2組の誤差の分散は2組の観測値の分散に比例するという暗黙の仮定を行うことと同等と見なすこともできます。私が知る限り、あなたはこれが間違っている方法を知らないと主張します。xy

グラフの赤い線はX上のYの OLS回帰、青い線は上のXの OLS回帰、緑の線はこの単純な方法です。勾配は約5であることに注意してください。YXXY

X0 <- 1600:3600
Y0 <- 5*X0 + 700
X1 <- X0 + 400*rnorm(2001)
Y1 <- Y0 + 2000*rnorm(2001)
slopeOLSXY  <- lm(Y1 ~ X1)$coefficients[2]     #OLS slope of Y on X
slopeOLSYX  <- 1/lm(X1 ~ Y1)$coefficients[2]   #Inverse of OLS slope of X on Y
slopesimple <- sd(Y1)/sd(X1) *sign(cov(X1,Y1)) #Simple slope
c(slopeOLSXY, slopeOLSYX, slopesimple)         #Show the three slopes
plot(Y1~X1)
abline(mean(Y1) - slopeOLSXY  * mean(X1), slopeOLSXY,  col="red")
abline(mean(Y1) - slopeOLSYX  * mean(X1), slopeOLSYX,  col="blue")
abline(mean(Y1) - slopesimple * mean(X1), slopesimple, col="green")

@Henry、あなたの定義βは、私にはどんな意味がありません。いくつかの「帽子」が欠落していますか?β^
枢機

観測された標準偏差を、観測された{ x i }の標準偏差で割ったものです。σsに変更します{yi}{xi}σs
ヘンリー

@ヘンリー、あなたのコメントのいくつかを明確にできますか?現在の説明に基づいて、何かが外れているように感じます。ましょうβ X yの傾きと仮定することyは応答であり、X予測因子です。ましょうβ Y 、Xスロープと仮定すること、xは応答であり、Y予測。次いで、β、X 、Y = ρ S Y / S X及びβ Y 、X = ρ S X /β^xyyxβ^yxxyβ^xy=ρ^sy/sx ρはサンプルでの相関との間のx yの。したがって、これらの二つの斜面の推定値の幾何平均はちょうどです ρβ^yx=ρ^sx/syρ^xyρ^
枢機

@cardinal:いいえを見ると、y = x / b c / bのように書き直すことができるので、傾きは1 / bになります。同じグラフ上に2つのOLS線を観測ポイントと一緒に描画しようとする場合(たとえば、垂直軸にy、水平軸にxを使用)、勾配の1つを反転する必要があります。私はあなたがの幾何平均取ることを意味だから、ρ S Y / のxおよびS yは/x=by+c1/by=x/bc/byxρ^sy/sx単に、SY/SX。または、両方のラインと観測ポイントに対してyxを逆方向にプロットするのに十分な型にはまらない場合、その逆を勾配として取得します。sy/ρ^sxsy/sxyx
ヘンリー

@ヘンリー-それは非常に興味深い答えです。私は必ずしもその妥当性を疑うわけではありませんが、驚いたことの1つは、Xの間の相関/共分散が答えに完全に欠けていることです。確かにこれ答えに関連するはずですか?YX
確率論的
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.