これはどんな分布ですか?


8

2つの変数間の共分散がゼロの制限分布に直面しましたが、それらの相関はです。そのような分布はありますか?どのように説明できますか?1


詳細を教えてください。OK、XとYは、分散と平均が異なる(nがない)2変量正規分布ですが、corr = 1-(1 / n)ですが、Yn | Xn = xの極限分布を調べます。


23
その分布は計算誤差と呼ばれます
QUITあり-Anony-Mousse

5
明らかな矛盾を解決するために、詳細を教えてください。どのような状況ですか?
Glen_b-2016

と共同配布についてさらに詳しく説明してください。特に、何がを引き起こしていますか?Y N ρ N = 1 - 1 / NXnYnρn=11/n
Mico 2016年

残念ながら、詳細はわかりません。あなたの質問は私も考えていた質問です。分散にnがない場合、ρnはnにどのように依存しますか?正確にはどういう意味ですか?
Behgol

なぜ共分散はだと思いますか?0
Juho Kokkala 2016年

回答:


5

OPによる明確化の結果、a)2つの変数が共同で2変量正規に従うと想定し、b)関心が条件付き分布にあると考えられます。

YnXn=x  N(μy+σyσxρn(xμx),(1ρn2)σy2)

次に、としてがあり、条件付き分布の分散がゼロにことがわかります。直感的に、相関が1になる場合、「知る」は「知る」にも十分です。ρ N1 、X 、Ynρn1xy

しかし、上記のどこにもがゼロであることはわかりません。限界でも、共分散は等しくなり。 Cov Cov(Yn,Xn)Cov(Yn,Xn)σyσx

条件付き共分散(および条件付き相関)は常にゼロであることに注意してください。

Cov(Yn,XnXn=x)=E(YnXnXn=x)E(YXn=x)E(XXn=x)

=xE(YnXn=x)xE(YXn=x)=0

これは、を調べることにより、ランダム変数の1つを定数に変えたためであり、定数は何にも共変しません。Xn=x


ご回答有難うございます。それは分散のない正規分布ですか?その形はどうでしょう?
Behgol


20

XY[1,1]

X=Yσx2XLIM σ 2 X0 COR X Y = 1limσx20cov(X,Y)=0limσx20cor(X,Y)=1

注1:の場合、分母が0になるため、相関は厳密には定義されません。σx2=0


あなたが正しいのかもしれません。OK XとYは、分散と平均が異なる(nは含まない)が、corr = 1-(1 / n)の二変量正規分布です。ここで、Yn | Xn = xの極限分布を調べます。
Behgol

「共分散はスケールに依存するため」という表現は、これが質問で示されていることを意味します。しかし、それは質問が意味する以上のもののようです。あなたはこれがそうであるかもしれないと仮定して、結論を述べているようです。それが間違っている場合は修正してください。
Nick Cox

18

私が見る限り(おそらくいくつかの特別な状況の外ではあるが、あなたは何も言わない)、それは不可能です。

相関は共分散を2つの標準偏差の積で割ったものであるため、共分散がゼロの場合、相関はゼロ(両方の標準偏差が非ゼロの場合)または未定義(少なくとも1つの標準偏差が0の場合)になります。共分散が0の場合、1であってはなりません。

私はあなたがあなたの分析で何らかの誤りを犯したか、あなたの説明が状況を正しく識別するには不十分であるかのいずれかであると思います。


1

データをガウスとして視覚化しているため、おそらく問題が発生しています。

すべてのデータが同じポイントを表す可能性があります(冗長になります)。また、データを構成する2つの変数の名前(別名)が異なる場合があります。これにより、共分散はゼロになり、相関は基本的に1になります。共分散は、データがフィーチャ空間全体にどの程度広がっているかを表し、相関は、ある変数が別の変数にどれだけ依存しているか、またはそれらが互いにどの程度影響し合っているかを表します。データがまったく分散していない場合、共分散はゼロでなければなりません。

注ただし、このようなデータセットで実行できる最善のことは、すべてのポイントが同じ出力であると単純に予測することです。これは、高いバイアスを与える可能性が高いです。


2
この回答にはかなり多くの異なることが起こっているようで、私はその関係を見るのに苦労しています。たとえば、パラグラフ1はどのように関連していますか?パラグラフ3はどのように関連していますか?また、どのようにして段落2で共分散ゼロに到達しますか?
Richard Hardy

指摘してくれた@Richard Hardyに感謝します。他の回答の1つは、最初はガウスソリューションを提案しました。それがパラグラフ1の理由です。パラグラフ3では、彼がそのようなデータセットで何ができるかについて私の見解を示しています。基本的に、共分散は、データが特徴空間全体にどの程度広がっているかを表します。データがで分散されていない場合、共分散はゼロでなければなりません。私もこれを回答に追加しました
RS Nikhil Krishna
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.