1つの変数の標準偏差が0の場合、相関はどうなりますか?


15

私が理解しているように、方程式を使用して共分散を正規化することで相関を得ることができます

ρi,j=cov(Xi,Xj)σiσj

ここで、は標準偏差です。 XIσi=E[(Xiμi)2]Xi

私の懸念は、標準偏差がゼロに等しい場合です。ゼロにならないことを保証する条件はありますか?

ありがとう。


11
標準偏差が0の変数は、別の(定数ではない)変数と相関させることはできません。相関とは、ある変数の大小値が別の変数の大小値にどのように対応するかの尺度です。変数の1つが確率1(標準偏差0の結果)の定数に等しい場合、 tは、他の変数が小さいか大きいかに関する情報を提供する可能性があります。慣例がわからないが、その場合は相関を0として定義する必要があるようだ。
マクロ

マクロに感謝します。あなたの考えは以下の答えと同じだと思います。ただし、ポイントの制限により、コメントを投票できませんでした。ありがとう。
チェプカ

4
あなたはすでに答えを受け入れているので、私はただコメントを書きます。確率変数場合標準偏差を有している、次に、他の確率変数のための(以降を確率)。したがって、相関係数は、不定形与えます。ために、従来で定義等しくなるように、この場合、これは、制限値の理由で擁護することができるとしてσ Y = 0 COV X Y = E [ X - μ XY - μ Y] = 0 X Y - μ Y= 0 1 ρ X Y = COV X Y YσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(YμY)=01 0ρX,Y=cov(X,Y)σXσY00 ρX,Y0ρX,YσY0など
ディリップサーワテ

6
@Dilip、それが答えなら答えとして行くべきです。回答がすでに受け入れられているかどうかは問題ではありません。
アンディW

1
@Dilip形式の問題は、制限操作によって特定の値を持つことができる場合でも、その値は制限をどのように取るかに依存することです。そのため、の引数は不完全です(そして説得力がない)。この規則を採用し、正当な理由でそれをサポートしているソースを引用できますか?00ρX,Y=0
whuber

回答:


14

SDの1つが0の場合、その方程式は定義されていません。ただし、これについて考えるより良い方法は、SDの1つが0の場合、相関がないことです。大まかに言えば、相関関係は、1つの変数が他の変数が動き回る様子を示しています。SDが0の場合、変数は「動き回っていない」ことを意味します。などの定数のベクトルが必要rep(constant, n_times)です。


どうもありがとう。それは理にかなっていると思います。興味深いのは、教科書がそのケースに言及しているのを見たことがないことです。
チェプカ

したがって、これは変数の一つのSDが0である場合、私は相関式は、2つの値を持つことを意味、一方が上式で与えられるようになると0相関係数の定義に制限され@gung
プラシャンス

@prashanth、私は思う。
GUNG -復活モニカ

2

考えるべきもう1つのことは、平均と標準偏差、および相関について話すときの基礎となる仮定です。

データサンプルについて話している場合、一般的な仮定の1つは、データが(少なくとも近似的に)正規分布している、または(たとえば、ログ変換を介して)変換できることです。標準偏差がゼロである場合、2つのシナリオがあります。実際には、標準偏差は非ゼロですが、非常に小さいため、データセットのサンプルはすべて平均値です(たとえば、粗い精度でデータを測定している場合); または、モデルの指定が間違っています。

この2番目のシナリオでは、標準偏差、したがって相関関係は無意味な尺度です。

より一般的には、相関が有効な概念であるためには、基礎となる分布の両方に有限の2次モーメント、したがって非ゼロの標準偏差が必要です。


元の質問は、データではなく(理論的な)分布に関するものであることに注意してください。
whuber

その場合、標準偏差がゼロの場合、平均値のみの測定値を持つ縮退した分布(つまり、定数関数)を意味します...標準偏差は、基礎となる分布が正常である場合にのみ意味があります。標準偏差がゼロの場合、ガウス分布のPDFは適切に定義されていないため、モデルでは許可されません。
tdc

トムのコメントにガウシアンが登場して驚いた。これは不必要な制限のようです。pdfの存在を要求することも制限されているようです(結局、pdfを持つ離散分布はありません)。また、二次モーメントが有限であるときはいつでも、SDが明確に定義されている(「意味のある」)ことに注意してください。これには、確率原子(「ディラックデルタ」関数)が含まれます。
whuber

オーケー、私はおそらく過度に制限的であったことに同意しますが、一般的にこれは人々がSDによって意味するものです。例えば、Wolframから:「標準偏差は、有限の最初の2モーメントを持つ分布に対して定義できますが、基礎となる分布が正規であると仮定するのが最も一般的です。」ただし、変数の1つがSD = 0である場合、相関の統計的概念の基礎となる基本的な仮定が満たされていません。
tdc

はい、トム、あなたの最後の声明はスポットライトであり、私は喜んでそれを受け入れます。ただし、それが表すアイデアは、返信にはあまり目立ちません。存在する場合は、正規分布、ログ、デルタ関数、および分布自体ではなくデータへのフォーカスに関する説明に埋もれています。ところで、Wolframサイトに表示される統計ステートメントに注意する必要があります。それは数学に非常に重点が置かれているため、統計的実践についての特徴付けが疑わしい場合があります。ここでは、まったく間違っています。SDの使用は、正規分布の設定をはるかに超えています。
whuber

2

相関は、2つのベクトル間の角度の余弦です。Yの標準偏差がゼロであると言うことは、ベクトルY-mean(Y)がゼロであること(または、より厳密には、適切なベクトル空間でゼロを表すこと)と同じです。それで、質問は「ゼロベクトルとベクトルX-mean(X)の間の角度(の余弦)について何が言えますか?」になります。より一般的には、内積のあるベクトル空間で、ゼロベクトルと他のベクトルの間の角度は何を意味しますか?私の意見では、これに対する答えは1つだけです。それは、この状況での「角度」の概念は無意味であり、したがってこの状況での相関の概念は無意味であるということです。


0

免責事項、私はすでに受け入れられた質の高い答えがあることを理解しているので、これは応答でなければなりませんが、私はそれを許可する経験ポイントを持っていません。@Dilipは、慣例として相関を0として定義できると述べましたが、真のゼロ(非ゼロSDの相関)とは解釈が大きく異なるため、これは問題のようです。元の質問は、「1つの変数のSDがゼロの場合」です。停止して「変数」の定義を考えると、答えへのより直接的なパスが得られます。SDが0の変数は変数ではなく、定数です。したがって、その場合、2つの変数はありません。そのため、概念的には相関を定義することはまったく意味がありません。


コメントするのに十分なポイントがない場合は、回答を通してコメントしないでください。
マイケルR.チャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.