逆独立変数による回帰


10

のは、私が持っているとしましょう -ベクトル従属変数のを、および -ベクトルの独立変数の。場合プロットされている、私は2つの間の直線関係(上昇傾向)があることがわかります。これは、と間に線形の下降傾向があることも意味します。Y N X Y 1NYNXY YX1XYX

ここで、回帰を実行した場合: と近似値を得ますY = β XY=βX+ϵY^=β^X

次に、回帰を実行します:とフィッティングされた値 Y = α 1Y=α1X+ϵY~=α^1X

2つの予測値、とはほぼ等しくなりますか? YY^Y~

回答:


10

 Yをに対してプロットすると、2つの間に線形関係(上昇傾向)があることがわかります。さて、これはYとXの間に線形の下降傾向があることも意味します1X

最後の文は間違っています。下降傾向がありますが、決して直線的ではありません。 Y〜1 / X Y〜X

関数と少しのノイズとしてを使用しました。あなたが見ることができるように、プロットしながら、反対線形挙動をもたらし、に対する遠い線形からです。 YY1f(x)=1xYY YX1XYX

(ポイント@whuberているに対してプロット等分散を見ていない。私は低いために高い分散を有するように見えると思う本質的であるため、非常に高い場合の密度のリードより広い範囲に私たち知覚。実際には、データは均一である:私はデータを生成するために使用したので、のサイズに依存しない。)1Y YX1XYY = 1 / X + rnorm (length (X), sd = 0.1)X

したがって、一般に、関係は非常に非線形です。つまり、範囲が近似できるほど狭い場合を除きます次に例を示します。d 1Xd1xdx=1x2const.

Y〜1 / X Y〜X

ボトムライン:

  • 一般に、タイプの関数を線形関数または多項式関数で近似することは非常に困難 です。そして、オフセット項がないと、妥当な近似値が得られません。1X
  • 間隔が線形近似を可能にするのに十分に狭い場合、データから関係が線形()ではなくことを推測することができなくなります。1X X1XX

無効な仮定から始めます。OPはとが線形関係にあることを表明していません。唯一の主張は、とが線形に関連しているように見えることです(負の傾き)。もちろん、これはとが非線形に関連していることを示しています。これは、あなたの投稿の残りの部分が読者をさらに誤解させるだけかもしれないという質問が仮定するものからの非常に厳しい出発だと思います。X Y 1 / X Y XYXY1/XYX
whuber

2
@whuber:すみませんが、今はかなり密度が高いようです。質問:「Yを1 / Xに対してプロットすると、線形関係(上昇傾向)があることがわかります。」それが私が1番目と3番目のイメージで表現しようとしたものです。Yは1 / Xよりも線形に増加しています。次に、対応するYをXにプロットしました(非線形、減少)。OPはどこで誤解されますか?
cbeleitesは、SX

1
申し訳ありませんが、私は(最初の画像のX軸のラベルを転置することにより)投稿を誤って読みました。責任はすべて私のものです。したがって、私はあなたの回答に賛成しています。これは正確で有益です。しかし、機会があれば、この変換が残差(対プロットで検出できる)の等分散性(またはその欠如)に及ぼす影響についてコメントすることをお勧めします。1 / XY1/X
whuber

同等分散性についての観察に感謝します。独立変数を変換することで、応答の等分散性は変更されません。(この現象は他のいくつかの投稿でも見られます。たとえば、人々は異分散性をグループの母集団の単なる違いに誤認します。)
whuber

非常に徹底した回答とコメント!@cbeleitesと@whuberに感謝します!
Mayou 2014

2

それらが一般に「ほぼ等しい」である理由はわかりません-しかし、ほぼ等しいとはどういう意味ですか?

これはおもちゃの例です:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

絵:

これらは「ほぼ等しい」とは程遠い

「青」モデルは、切片(つまり、定数)項を持つことが許可されている場合、はるかに優れています...


青いモデルで何をしているのかを理解するのは難しいですが、それは確かにOPが説明しているものとは異なります!赤いものは、質問で提示された状況に非常に近いです。
whuber

@cbeleitesオフセットの欠如は、それ以外ではなにが謎であったかを説明します。エイドリアン、あなたは正しいですが、あなたの例がOPのデータに大きな影響を与えているとは思いません。ポストはしている状況を説明し対あなたは良好な関係が間にある状況を示し、一方、(任意のインターセプトなし)プロットが良いの一つであるように思われるが及び -そしてそう、もちろん対フィットはひどいです。1 / X Y X Y 1 / XY1/XYXY1/X
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.