回答:
共分散は、1つの変数の変化が2番目の変数の変化にどのように関連付けられるかの尺度です。具体的には、共分散は、2つの変数が線形に関連付けられている度合いを測定します。ただし、単調に関連する2つの変数の一般的な尺度として、非公式に使用されることもよくあります。ここには、共分散に関する多くの便利で直感的な説明があります。
共分散があなたが言及した各用語にどのように関係しているかについて:
(1) 相関は、値をとる共分散のスケーリングされたバージョンです。相関は完全な線形結合を示し、は線形関係を示しません。このスケーリングにより、元の変数のスケールの変化に対して相関関係が不変になります(Akavallが指摘し、+ 1の例を示します)。スケーリング定数は、2つの変数の標準偏差の積です。 ± 1 0
(2) 2つの変数が独立している場合、それらの共分散はです。ただし、共分散がことは、変数が独立していることを意味するものではありません。この図(ウィキペディアより)0
は、独立していないデータのプロット例をいくつか示していますが、それらの共分散はです。1つの重要な特別なケースは、2つの変数が一緒に正規分布している場合、それらが無相関である場合にのみ独立しているということです。別の特別なケースは、ベルヌーイ変数のペアが独立している場合にのみ相関がないことです(@cardinalに感謝)。
(3)反復測定設計の分散/共分散構造(単に共分散構造と呼ばれることが多い)は、個人の反復測定が潜在的に相関している(したがって依存している)事実をモデル化するために使用される構造を指します-これは、反復測定の共分散行列のエントリ。一例は、一定の分散を持つ交換可能な相関構造です。これは、繰り返される各測定が同じ分散を持ち、すべての測定ペアが等しく相関することを指定します。より良い選択は、時間的に離れて行われる2つの測定値の相関を低くする必要がある共分散構造を指定することです(例:自己回帰モデル)。共分散構造という用語は、より一般的に、観測値の相関が許可されている多くの種類の多変量解析で生じることに注意してください。
マクロの答えは優れていますが、共分散が相関とどのように関係しているかという点にさらに加えたいと思います。共分散は、2つの変数間の関係の強さを実際には伝えませんが、相関は示します。例えば:
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
次に、スケールを変更して、xとyの両方に10を掛けます
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
スケールを変更しても関係の強さは増加しないため、共分散をxおよびyの標準偏差で除算することで調整できます。これは相関係数の定義です。
上記の両方の場合で、xとyの間の相関係数は0.98198
です。