相関は、2つの変数間の線形関連性の尺度です。決定係数は、1つの変数の変動がどれだけ他の変数の「説明」できるかを示す尺度です。
たとえば、が2つの変数間の相関である場合、です。したがって、一方の変動の64%は、他方の違いによって説明できます。正しい?r 2 = 0.64
私の質問は、記載されている例では、次のステートメントのいずれかが正しいですか?
- 値の64%が回帰直線に沿っています
- 値の80%が回帰直線に沿って落ちます
相関は、2つの変数間の線形関連性の尺度です。決定係数は、1つの変数の変動がどれだけ他の変数の「説明」できるかを示す尺度です。
たとえば、が2つの変数間の相関である場合、です。したがって、一方の変動の64%は、他方の違いによって説明できます。正しい?r 2 = 0.64
私の質問は、記載されている例では、次のステートメントのいずれかが正しいですか?
回答:
この最初の部分は基本的に正しいですが、バリエーションの64%はモデルによって説明されています。単純な線形回帰:Y〜X 、が.64の場合、Yの変動の64%がYとXの線形関係によって決定されることを意味します。非常に低いR 2と強い関係を持つことが可能です、関係が強く非線形の場合。
2つの番号の付いた質問については、どちらも正しくありません。実際、どの点も回帰線上に正確に存在することはできません。それは測定されているものではありません。むしろ、平均点が線にどれだけ近いかという問題です。すべてまたはほぼすべてのポイントが近い場合(たとえライン上に正確にポイントがない場合でも)、は高くなります。ほとんどのポイントがラインから離れている場合、R 2は低くなります。ほとんどのポイントが近いが、いくつかのポイントが遠い場合、回帰は正しくありません(外れ値の問題)。他のこともうまくいかない可能性があります。
さらに、私は「遠い」という概念を曖昧に残しました。これは、Xの広がり具合によって異なります。これらの概念を正確にすることは、回帰のコースで学ぶことの一部です。ここには入りません。
あなたはあなたの声明の最初の部分で正しいです。決定係数を解釈する通常の方法は、説明変数で説明できる従属変数y(V a r (y ))の変動の割合としてです。決定係数R 2の正確な解釈と導出はここにあります
http://economictheoryblog.com/2014/11/05/the-coefficient-of-determination-latex-r2/
ただし、決定係数あまり知られていない解釈は、観測値y iの間の平方ピアソン相関係数として解釈することです。及び近似値Y I。決意の係数は観測値間の二乗ピアソン相関係数と同等であることを証明Y I及びフィット値Y iは、ここで見つけることができ
http://economictheoryblog.com/2014/11/05/proof/
私の見解では、これらは決定係数を解釈する唯一の意味のある方法です。したがって、作成した2つのステートメントはR 2から導出することはできません。