タグ付けされた質問 「covariance」

共分散は、2つの変数間の線形関係の強さと方向を測定するために使用される量です。共分散はスケーリングされていないため、しばしば解釈が困難です。変数のSDでスケーリングすると、ピアソンの相関係数になります。

3
共分散とスピアマンのローのサイン
2つの変数間の共分散が常に SpearmanのRhoと同じ符号であるという証明、または両方がゼロでないと仮定した人、またはこれが当てはまらない理由を示す説明/反例はありますか? 私は「母集団」(理論的)の大きさについて話しているのであって、それらのサンプルの対応物について話しているのではありません。つまり、場合、分布関数があり、必要なすべてのモーメント、コモーメントなどが存在する2つの確率変数が存在します。X,YX,YX, YFX,FYFX,FYF_X, F_Y Cov(X,Y)=E(XY)−E(X)E(Y)Cov(X,Y)=E(XY)−E(X)E(Y)\text{Cov}(X,Y) = E(XY) - E(X)E(Y) while ρs(X,Y)=Cov[FX(X),FY(Y)]ρs(X,Y)=Cov[FX(X),FY(Y)]\rho_s(X,Y) = \text{Cov}[F_X(X),F_Y(Y)] 私があればということを知っている(依存クアドラントある)、正または負、これは確かに、保持していますX,YX,YX,YQDQDQD (X,Y)=QD⟹sign{Cov(X,Y)}=sign{ρs(X,Y)}(X,Y)=QD⟹sign{Cov(X,Y)}=sign{ρs(X,Y)}(X,Y) = QD \implies \text{sign}\left\{\text{Cov}(X,Y)\right\} = \text{sign}\left\{\rho_s(X,Y)\right\} ...再度、両方がゼロでない場合。しかし、を確立できない、または保持できない場合はどうなりますか?QDQDQD 私は最終的に後の午前する証拠である場合の増加単調変換である、次に。これは非常に直感的で「自明」であるように見えることは知っていますが、そのような証拠をどこにも見つけることができず、自分で証明することもできませんでした。より正確には、私が示したいのは、両方がゼロでなければ、反対の符号を持つことはできないということです。h(Y)h(Y)h(Y)YYYsign{Cov(X,Y)}=sign{Cov(X,h(Y))}sign{Cov(X,Y)}=sign{Cov(X,h(Y))}\text{sign}\left\{\text{Cov}(X,Y)\right\} = \text{sign}\left\{\text{Cov}(X,h(Y))\right\} ここで、スピアマンのローは単調変換に対して不変なので、があるので、共分散の「同じ符号」の結果を証明する方法は、共分散が常にスピアマンのローと同じ符号を持っていることを証明するため、この質問。ρs(X,Y)=ρs(X,h(Y))ρs(X,Y)=ρs(X,h(Y))\rho_s(X,Y) = \rho_s(X,h(Y)) と定義を「非常に近い」ものにするW. Hoeffdingによる共分散の古い美しい式を見つけましたが、象限依存を仮定しないと一般的なステートメントを証明できませんでした。CovCov\text{Cov}ρsρs\rho_s もちろん、誰かが共分散の「同じ符号」(望ましい)結果に直接何かを持っている場合、それは同様に役立ちます。 更新 私は関連しているが同一ではないこの質問を見つけました。すでに述べたように、それは私の質問を次のように変更します:「両方のメジャーがゼロでないと仮定します。それらは反対の符号を持つことができますか?」


2
ガウス過程と相関
私はなぜ人々がガウス過程(GP)を使って未知の(時には決定論的)関数をモデル化するのか疑問に思っています。たとえば、未知の関数考えます。この関数から3つの独立した観測結果があります。 y=f(x)y=f(x)y=f(x)(x1,y1);(x2,y2);(x3,y3)(x1,y1);(x2,y2);(x3,y3)\big(x_1,y_1); \big(x_2,y_2); \big(x_3,y_3) 基になる関数を学ぶために、GPはすべての出力を共通の多変量正規分布として扱う一般的なノンパラメトリック手法です。特定の共分散関数 を想定し、以下を想定します。 GPは次の形式を取ります K(xi,yi)K(xi,yi)K(x_i,y_i)y=(y1,y2,y3);X=(x1,x2,x3)y=(y1,y2,y3);X=(x1,x2,x3)\mathbf{y}=(y_1,y_2,y_3);\mathbf{X}=(x_1,x_2,x_3)y|X∼N(0,⎡⎣⎢K(x1,x1)K(x1,x2)K(x1,x3)K(x1,x2)K(x2,x2)K(x2,x3)K(x1,x3)K(x2,x3)K(x3,x3) ⎤⎦⎥)y|X∼N(0,[K(x1,x1)K(x1,x2)K(x1,x3)K(x1,x2)K(x2,x2)K(x2,x3)K(x1,x3)K(x2,x3)K(x3,x3) ])\\ \bf{y}|X \sim N\Bigg(\mathbf{0},\begin{bmatrix} K(x_1,x_1) & K(x_1,x_2) & K(x_1,x_3) \\ K(x_1,x_2) & K(x_2,x_2) & K(x_2,x_3) \\ K(x_1,x_3) & K(x_2,x_3) & K(x_3,x_3) \ \end{bmatrix}\Bigg)\\ 観測は独立しています。それらの唯一の共通点は、それらが同じ基本的な機能に由来することです。 (xi,yi)(xi,yi)\big(x_i,y_i) 私の主な質問は次のとおりです。なぜとを相関させる必要があるのですか?それは間違ったモデルではありませんか?どのようなについても、良い予測結果が得られると想定できるのはなぜですか。(xi,yj)(xi,yj)\big(x_i,y_j)(xl,ym)(xl,ym)\big(x_{l},y_{m})y|xy|xy|x この問題で私が見逃している側面や、なぜ相関を強制することが役立つのかわかりません。

3
共分散の平方根/精度行列の意味
たとえば、は、共分散確率変数です。定義により、共分散行列のエントリは共分散です: また、精度エントリは次の条件を満たすことが知られています: ここで、右側はと他のすべての変数を条件とする共分散です。X∈RnX∈RnX \in \mathbb{R}^nΣ∈Rn×nΣ∈Rn×n\Sigma \in \mathbb{R}^{n\times n}Σij=Cov(Xi,Xj).Σij=Cov(Xi,Xj). \Sigma_{ij} = Cov( X_i,X_j). Σ−1Σ−1\Sigma^{-1}Σ−1ij=Cov(Xi,Xj|{Xk}nk=1∖Xi,Xj}),Σij−1=Cov(Xi,Xj|{Xk}k=1n∖Xi,Xj}), \Sigma^{-1}_{ij} = Cov(X_i,X_j| \{X_k\}_{k=1}^n \backslash X_i,X_j\}), XiXiX_iXjXjX_j または平方根のエントリに対する統計的解釈はありますか?正方行列平方根とは、ような行列を意味します。上記の行列の固有値分解は、私が見る限り、そのようなエントリごとの解釈を与えません。ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1}AAAMMMMtM=AMtM=AM^tM = A

3
標本相関は常に標本分散と正の相関がありますか?
サンプル相関とサンプル標準偏差(と呼ぶ)は、正の真の相関を持つ二変量正規、をシミュレートすると正の相関があるように見えます(と間の真の相関が負の場合は負の相関があるようです)負)。これはやや直観に反することがわかりました。非常にヒューリスティックに、がXの1 SDの増加に対するYの予想される増加(SD(Y)の単位)を表すという事実を反映していると思いますが大きくなると推定すると、はYの変化を反映します。 Xのより大きな変更に関連付けられています。rrrバツXXsバツsXs_XバツXXYYYバツXXYYYrrrsバツsXs_Xrrr しかし、私はかどうかを知りたいのため(少なくともX及びYは、正常と大きいnの二変量である場合について)一般的に成り立ちます。まかせ表す真SD、我々が持っています:Co v (r 、sバツ)> 0Cov(r,sx)>0Cov(r, s_x) >0r > 0r>0r>0σσ\sigma Co v (r 、sバツ)= E[ rsバツ] - ρσバツCov(r,sX)=E[rsX]−ρσxCov(r, s_X) = E [ r s_X] - \rho \sigma_x ≈ E[Co vˆ(X、Y)sY] −Co v (X、Y)σY≈E[Cov^(X,Y)sY]−Cov(X,Y)σY \approx E \Bigg[ \frac{\widehat{Cov}(X,Y)}{s_Y} \Bigg] - \frac{Cov(X,Y)}{\sigma_Y} 最初の項でテイラー展開を使用してみましたが、それはにため、行き止まりです。何か案は?Co v (Co vˆ(X、Y)、sY)Cov(Cov^(X,Y),sY)Cov(\widehat{Cov}(X,Y), s_Y) 編集 たぶん、より良い方向は、であることを示すことを試みることですここで、は、X上のYのOLS係数です。それから、、これは望ましい結果を意味します。以来ほとんどのサンプル手段の違いのようなものです、多分私達は通常のRV用のサンプル平均と分散の既知の独立性のようなものを使用して元の結果を得ることができますか?Co v …

2
コーシー確率変数の依存性の定量化
2つのコーシー確率変数および与えられます。それは独立していない。確率変数の依存構造は、多くの場合、それらの共分散または相関係数で定量化できます。ただし、これらのコーシー確率変数にはモーメントがありません。したがって、共分散と相関は存在しません。θ1∼Cauchy(x(1)0,γ(1))θ1∼Cauchy(x0(1),γ(1))\theta_1 \sim \mathrm{Cauchy}(x_0^{(1)}, \gamma^{(1)})θ2∼Cauchy(x(2)0,γ(2))θ2∼Cauchy(x0(2),γ(2))\theta_2 \sim \mathrm{Cauchy}(x_0^{(2)}, \gamma^{(2)}) 確率変数の依存関係を表す他の方法はありますか?モンテカルロでそれらを推定することは可能ですか?

1
実験数が二項分布されている二項分布
私のセットアップでは、 ある試験は。mmm 各試行には、選択される確率あります。qqq N≤mN≤mN \leq m は選択された試行の数です →N∼Bin(q,m)→N∼Bin(q,m) \rightarrow N \sim \text{Bin}(q, m) 選択した試行のそれぞれについて、成功の確率はNNNppp K≤NK≤NK\leq Nは成功した試行の数です →(K|N)∼Bin(p,N)→(K|N)∼Bin(p,N) \rightarrow (K|N) \sim \text{Bin}(p, N) 私はすでに、およびE[K]=qmpE[K]=qmpE[K] = qmp Var(K)=qmp(1−p)+p2mq(1−q)Var(K)=qmp(1−p)+p2mq(1−q)Var(K)= qmp(1-p) + p^2 m q(1-q) しかし、私は導出に行き詰まっています。私はこれを解決するための助けをいただければ幸いです。cov(K,N)cov(K,N)cov(K, N)

2
GLM標準エラー
GLMモデルの係数の標準誤差を取得する方法について質問があります。手作業で計算したフィッシャー情報マトリックスを持っていますが、スケーリングされていません。GLM関数から同じ標準エラーを取得できるように、フィッシャー情報マトリックスをどのようにスケーリングできますか?

1
独立したNormal(0,1)変数UおよびVのX = min(U、V)およびY = max(U、V)であるcov(X、Y)とは何ですか?
みましょう: U、V〜私。私。d。N(0 、1 )U、V〜私。私。d。N(0、1)U, V \overset{i.i.d.}{\sim} \mathcal{N}(0,1)、つまり、独立した標準正規確率変数。 バツ= 分(U、V)バツ=分(U、V)X=\min(U,V) Y= 最大(U、V)Y=最高(U、V)Y=\max(U,V) バツバツXとYの共分散は何YYYですか? 関連:独立した均一(0,1)変数UおよびVのX = min(U、V)およびY = max(U、V)であるcov(X、Y)とは何ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.