21

通常、相関係数は大文字の記述されますが、そうでない場合もあります。r 2R 2の間に本当に違いがあるのだろうか?缶R相関係数よりも、他の平均何か?Rr2R2r


7
私はこの質問がダウン投票されたことに驚いています-それは明確で明確に指定されており、用語が一貫性のない方法で使用されている問題をカバーしています。さらに悪いことに、大文字と小文字が区別されるため、説明を検索するのは難しいトピックです。脇という事実からときに我々は、インターセプト条件なしモデルを考えるときに、2つの全く異なるものを使用することができ、状況はさらに悪化R 2、決意の係数は、さえの正方形のと同じではありませんR。表記法がわかりにくいのは驚くことではありません。rR2R
シルバーフィッシュ

回答:


18

この問題の表記法は少し異なるようです。

は多重相関のコンテキストで使用され、「多重相関係数」と呼ばれます。これは、観測された応答との間の相関であり、 Y及び Yは、モデルによって装着しました。Yは、一般的に、いくつかの予測変数から予測される X iは、例えば、 Y = β 0 + β 1 X 1 + β 2 X 2切片と傾き係数 β iはデータから推定されています。なお、 0RYY^Y^XiY^=β^0+β^1X1+β^2X2β^i0R1

記号は、2変量の場合に使用される「サンプル相関係数」です。つまり、XYの 2つの変数があり、通常、サンプルのXYの間の相関を意味します。これを、より広い母集団の2つの変数間の相関ρの推定値として扱うことができます。2つの変数を相関させるために、どちらが予測変数でどちらが応答であるかを識別する必要はありません。実際、YXの相関が見つかった場合、相関は対称であるため、XYの相関と同じになります。rXYXYρYXXY。そのノートシンボルrがこのように使用される、とR < 0(負の相関)は、2つの変数が直線的に減少する関係(一方が上昇するように、他方が下がる傾向がある)している場合。1r1rr<0

表記が不整合になるのは、2つの変数Yがあり、単純な線形回帰が実行される場合です。これは一つの変数、識別Yを応答変数、およびその他、のように、X予測変数として、およびモデルフィッティングY = β 0 + β 1 Xを。一部の人々はまた、シンボル使用rはとの間の相関関係を示すために、Y及びYが、一方、他の書き込み(重回帰との整合性のため)RXYYXY^=β^0+β^1XrYY^R。観測された応答と近似された応答の相関は、必ずゼロ以上であることに注意してください。これは私がシンボルの使用好きではない理由の一つであるこの場合:間の相関XYの間の相関ながら、負のかもしれないYYが正である(実際には、単に弾性率になりますXYの間の相関)まだ両方とも記号rで書かれているかもしれません。私はいくつかの教科書とウィキペディアの記事を見てきましたが、rの2つの意味をほぼ同じように切り替えて、それが不必要に混乱することを発見しました。記号Rを使用したいrXYYY^XYrrR間の相関のためのYの両方の単一および複数の回帰です。YY^

限り切片項が存在するようにモデルに嵌合シンプルかつ複数regresion両方で、次に、との間のY及びYは、単に決意の係数の平方根であるR 2RYY^R2(しばしば呼ばれる「分散の割合を説明」または同様)。具体的には単純な線形回帰の場合、R2=r2XYの間の相関についてを記述しているR 2 = r 2であり、R 2は回帰の決定係数または相関の平方rXYR2および Y。以降 - 1 R 1 0 R 1、この手段その R = | r | 。だから、例えば、あなたがとの間の相関取得する場合、X Y Rを= - 0.7、その後間の相関 Yと嵌合 Y回帰直線状の単純なものから Y = β 0 + β 1 XYY^1r10R1R=|r|XYr=0.7YY^Y=β^0+β^1X would be R=0.7 and the coefficient of determination would be R2=0.49 i.e. almost half of variation in the response would be explained by your model.

If no intercept term was included in the model, then the symbol R2 is ambiguous. It is usually intended as the coefficient of determination, but this will generally be calculated in a different way to usual, so take care when reading the output from your statistical software. Then it is no longer the same as the square of the multiple correlation R, nor in the bivariate case will it equal r2!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.