回答:
場合及び、ランダムな変数としているとbは、次いで、定数である
Covを(X + 、Y + B )
また、相関はCorr (X 、Y )= Cov (X 、Y )として定義されているため
それは物語の人口バージョンでした。サンプルバージョンは同じです:を使用する場合
「どこか」はかなり信頼できないソースになる傾向があります...
共分散/相関は、明示的なセンタリングで定義されます。データを中央に配置しない場合は、共分散/相関を計算していません。(正確には、ピアソン相関)
主な違いは、理論モデルに基づいて(たとえば、期待値は正確に0であると想定される)中心にするか、データ(算術平均)に基づく中心にするかです。算術平均では、他のどの中心よりも小さい共分散が得られることが簡単にわかります。
ただし、共分散が小さいことは、相関が小さいことを意味しません。データX =(1,2)およびY =(2,1)があるとします。算術平均のセンタリングを使用すると、完全に負の相関が得られることが容易にわかります。一方、生成プロセスが平均0を生成することがわかっている場合、データは実際には正の相関です。したがって、この例では、中央揃えですが、理論上の期待値は0です。
これは簡単に発生する可能性があります。セルの番号が-5から+5のセンサーアレイ11x11があるとします。算術平均をとるのではなく、ここでセンサーイベントの相関を探すときにセンサーアレイの「物理」平均を使用することは理にかなっています(セル0〜10を列挙した場合、固定平均として5を使用します)まったく同じ結果が得られるので、インデックス作成の選択は分析から消えます-素晴らしいです)。