通常、相関係数は大文字の記述されますが、そうでない場合もあります。r 2とR 2の間に本当に違いがあるのだろうか?缶R相関係数よりも、他の平均何か?
通常、相関係数は大文字の記述されますが、そうでない場合もあります。r 2とR 2の間に本当に違いがあるのだろうか?缶R相関係数よりも、他の平均何か?
回答:
この問題の表記法は少し異なるようです。
は多重相関のコンテキストで使用され、「多重相関係数」と呼ばれます。これは、観測された応答との間の相関であり、 Y及び Yは、モデルによって装着しました。Yは、一般的に、いくつかの予測変数から予測される X iは、例えば、 Y = β 0 + β 1 X 1 + β 2 X 2切片と傾き係数 β iはデータから推定されています。なお、 0。
記号は、2変量の場合に使用される「サンプル相関係数」です。つまり、XとYの 2つの変数があり、通常、サンプルのXとYの間の相関を意味します。これを、より広い母集団の2つの変数間の相関ρの推定値として扱うことができます。2つの変数を相関させるために、どちらが予測変数でどちらが応答であるかを識別する必要はありません。実際、YとXの相関が見つかった場合、相関は対称であるため、XとYの相関と同じになります。。そのノートシンボルrがこのように使用される、とR < 0(負の相関)は、2つの変数が直線的に減少する関係(一方が上昇するように、他方が下がる傾向がある)している場合。
表記が不整合になるのは、2つの変数とYがあり、単純な線形回帰が実行される場合です。これは一つの変数、識別Yを応答変数、およびその他、のように、X予測変数として、およびモデルフィッティングY = β 0 + β 1 Xを。一部の人々はまた、シンボル使用rはとの間の相関関係を示すために、Y及びYが、一方、他の書き込み(重回帰との整合性のため)R。観測された応答と近似された応答の相関は、必ずゼロ以上であることに注意してください。これは私がシンボルの使用好きではない理由の一つであるこの場合:間の相関XとYの間の相関ながら、負のかもしれないYとYが正である(実際には、単に弾性率になりますXとYの間の相関)まだ両方とも記号rで書かれているかもしれません。私はいくつかの教科書とウィキペディアの記事を見てきましたが、rの2つの意味をほぼ同じように切り替えて、それが不必要に混乱することを発見しました。記号Rを使用したい間の相関のためのとYの両方の単一および複数の回帰です。
限り切片項が存在するようにモデルに嵌合シンプルかつ複数regresion両方で、次に、との間のY及びYは、単に決意の係数の平方根であるR 2(しばしば呼ばれる「分散の割合を説明」または同様)。具体的には単純な線形回帰の場合、XとYの間の相関についてを記述しているR 2 = r 2であり、R 2は回帰の決定係数または相関の平方および Y。以降 - 1 ≤ R ≤ 1と 0 ≤ R ≤ 1、この手段その R = | r | 。だから、例えば、あなたがとの間の相関取得する場合、Xと Yの Rを= - 0.7、その後間の相関 Yと嵌合 Y回帰直線状の単純なものから Y = β 0 + β 1 X would be and the coefficient of determination would be i.e. almost half of variation in the response would be explained by your model.
If no intercept term was included in the model, then the symbol is ambiguous. It is usually intended as the coefficient of determination, but this will generally be calculated in a different way to usual, so take care when reading the output from your statistical software. Then it is no longer the same as the square of the multiple correlation , nor in the bivariate case will it equal !