2つの変数間の共分散がゼロの制限分布に直面しましたが、それらの相関はです。そのような分布はありますか?どのように説明できますか?
詳細を教えてください。OK、XとYは、分散と平均が異なる(nがない)2変量正規分布ですが、corr = 1-(1 / n)ですが、Yn | Xn = xの極限分布を調べます。
2つの変数間の共分散がゼロの制限分布に直面しましたが、それらの相関はです。そのような分布はありますか?どのように説明できますか?
詳細を教えてください。OK、XとYは、分散と平均が異なる(nがない)2変量正規分布ですが、corr = 1-(1 / n)ですが、Yn | Xn = xの極限分布を調べます。
回答:
OPによる明確化の結果、a)2つの変数が共同で2変量正規に従うと想定し、b)関心が条件付き分布にあると考えられます。
次に、としてがあり、条件付き分布の分散がゼロにことがわかります。直感的に、相関が1になる場合、「知る」は「知る」にも十分です。ρ N → 1 、X 、Y
しかし、上記のどこにもがゼロであることはわかりません。限界でも、共分散は等しくなり。 Cov (
条件付き共分散(および条件付き相関)は常にゼロであることに注意してください。
これは、を調べることにより、ランダム変数の1つを定数に変えたためであり、定数は何にも共変しません。
LIM σ 2 X → 0 COR (X 、Y )= 1
注1:の場合、分母が0になるため、相関は厳密には定義されません。
私が見る限り(おそらくいくつかの特別な状況の外ではあるが、あなたは何も言わない)、それは不可能です。
相関は共分散を2つの標準偏差の積で割ったものであるため、共分散がゼロの場合、相関はゼロ(両方の標準偏差が非ゼロの場合)または未定義(少なくとも1つの標準偏差が0の場合)になります。共分散が0の場合、1であってはなりません。
私はあなたがあなたの分析で何らかの誤りを犯したか、あなたの説明が状況を正しく識別するには不十分であるかのいずれかであると思います。
データをガウスとして視覚化しているため、おそらく問題が発生しています。
すべてのデータが同じポイントを表す可能性があります(冗長になります)。また、データを構成する2つの変数の名前(別名)が異なる場合があります。これにより、共分散はゼロになり、相関は基本的に1になります。共分散は、データがフィーチャ空間全体にどの程度広がっているかを表し、相関は、ある変数が別の変数にどれだけ依存しているか、またはそれらが互いにどの程度影響し合っているかを表します。データがまったく分散していない場合、共分散はゼロでなければなりません。
注ただし、このようなデータセットで実行できる最善のことは、すべてのポイントが同じ出力であると単純に予測することです。これは、高いバイアスを与える可能性が高いです。