タグ付けされた質問 「covariance」

共分散は、2つの変数間の線形関係の強さと方向を測定するために使用される量です。共分散はスケーリングされていないため、しばしば解釈が困難です。変数のSDでスケーリングすると、ピアソンの相関係数になります。

2
時系列の与えられたパワーとクロススペクトル密度のシミュレーション
共分散行列(それらのパワースペクトル密度(PSD)およびクロスパワースペクトル密度(CSD))を考えると、一連の定常色付き時系列の生成に問題があります。 2つの時系列と与えられると、yI(t)yI(t)y_{I}(t)yJ(t)yJ(t)y_{J}(t)ような多くの広く利用可能なルーチンを使用して、パワースペクトル密度(PSD)およびクロススペクトル密度(CSD)を推定できることを知っていますMatlabなどの関数psd()とcsd()関数。PSDとCSDは共分散行列を構成します C(f)=(PII(f)PJI(f)PIJ(f)PJJ(f)),C(f)=(PII(f)PIJ(f)PJI(f)PJJ(f)), \mathbf{C}(f) = \left( \begin{array}{cc} P_{II}(f) & P_{IJ}(f)\\ P_{JI}(f) & P_{JJ}(f) \end{array} \right)\;, これは一般に周波数fff関数です。 逆にしたい場合はどうなりますか? 共分散行列が与えられた場合、yI(t)yI(t)y_{I}(t)とyJ(t)yJ(t)y_{J}(t)実現をどのように生成しますか? 背景理論を含めるか、これを行う既存のツールを指摘してください(Pythonのすべてが素晴らしいでしょう)。 私の試み 以下は、私が試したものと、私が気づいた問題の説明です。少し長い間読んでおり、誤用された用語が含まれている場合は申し訳ありません。間違っていることが指摘できる場合、それは非常に役立ちます。しかし、私の質問は上記の太字のものです。 PSDとCSDは、時系列のフーリエ変換の積の期待値(またはアンサンブル平均)として記述できます。したがって、共分散行列は次のように記述できます C(f)=2τ⟨Y†(f)Y(f)⟩,C(f)=2τ⟨Y†(f)Y(f)⟩, \mathbf{C}(f) = \frac{2}{\tau} \langle \mathbf{Y}^{\dagger}(f) \mathbf{Y}(f) \rangle \;, ここで、 Y(f)=(y~I(f)y~J(f)).Y(f)=(y~I(f)y~J(f)). \mathbf{Y}(f) = \left( \begin{array}{cc} \tilde{y}_{I}(f) & \tilde{y}_{J}(f) \end{array} \right) \;. 共分散行列はエルミート行列であり、ゼロまたは正の実固有値を持ちます。だから、に分解することができる C(f)= X(f)λ12(f)私λ12(f)X†(f)、C(f)=バツ(f)λ12(f)私λ12(f)バツ†(f)、 \mathbf{C}(f) = \mathbf{X}(f) \boldsymbol\lambda^{\frac{1}{2}}(f) …


4
実際には、混合効果モデルでランダム効果共分散行列はどのように計算されますか?
基本的に私が思っているのは、異なる共分散構造がどのように適用され、これらの行列内の値がどのように計算されるかです。lme()などの関数を使用すると、どの構造が必要かを選択できますが、それらの推定方法を知りたいと思います。 線形混合効果モデル考えます。Y=Xβ+Zu+ϵY=Xβ+Zu+ϵY=X\beta+Zu+\epsilon ここで、および。さらに:ε D 〜 N (0 、R )u∼dN(0,D)u∼dN(0,D)u \stackrel{d}{\sim} N(0,D)ϵ∼dN(0,R)ϵ∼dN(0,R)\epsilon \stackrel{d}{\sim} N(0,R) Var(Y|X,Z,β,u)=RVar(Y|X,Z,β,u)=RVar(Y|X,Z,\beta,u)=R Var(Y|X,β)=Z′DZ+R=VVar(Y|X,β)=Z′DZ+R=VVar(Y|X,\beta)=Z'DZ+R=V 簡単にするために、ます。R=σ2InR=σ2InR=\sigma^2I_n 基本的に私の質問は、さまざまなパラメーター化のデータからどの程度正確に推定するかです。が対角(ランダム効果は独立)であるか、Dが完全にパラメーター化されている(現時点でより興味がある場合)か、他のさまざまなパラメーター化のいずれかであると仮定しますか?これらの簡単な推定量/方程式はありますか?(それは間違いなく繰り返し推定されるでしょう。)D DDDDDDDDDD 編集: 書籍Variance Components(Searle、Casella、McCulloch 2006)から、私は何とか次のように光り輝くことができました。 もしD=σ2uIqD=σu2IqD=\sigma^2_uI_q次のように、その後、分散コンポーネントが更新され、計算されます。 σ2(k+1)u=u^Tu^σ2(k)utrace(V−1ZTZ)σu2(k+1)=u^Tu^σu2(k)trace(V−1ZTZ)\sigma_u^{2(k+1)} = \frac{\hat{\textbf{u}}^T\hat{\textbf{u}}} {\sigma_u^{2(k)}\text{trace}(\textbf{V}^{-1}\textbf{Z}^T\textbf{Z})} σ2(k+1)e=Y′(Y−Xβ^(k)−Zu^(k))/nσe2(k+1)=Y′(Y−Xβ^(k)−Zu^(k))/n\sigma_e^{2(k+1)} = Y'(Y-X{\hat{\beta}}^{(k)}-{Z}\hat{{u}}^{(k)})/n ここで、β^(k)β^(k)\hat{\beta}^{(k)}およびu^(k)u^(k)\hat{{u}}^{(k)}はそれぞれkkk番目の更新です。 DDDがブロック対角または完全にパラメーター化されている場合の一般的な式はありますか?完全にパラメータ化されたケースでは、コレスキー分解を使用して、正定性と対称性を確保しています。

4
独立性がゼロ相関を意味するのはなぜですか?
まず第一に、私はこれを求めていません: ゼロ相関が独立性を意味しないのはなぜですか? これは(むしろうまく)ここで対処されています:https : //math.stackexchange.com/questions/444408/why-does-zero-correlation-not-imply-independence 私が求めているのは逆です... 2つの変数は互いに完全に独立しています。 彼らは偶然にわずかな相関関係を持っていなかったのでしょうか? そうではないはずです...独立は、非常に小さい相関を意味しますか?

5
共分散行列からの「分散」の尺度?
データが1dの場合、分散はデータポイントが互いに異なる程度を示します。データが多次元の場合、共分散行列を取得します。 多次元データの場合、一般にデータポイントが互いにどのように異なるかを示す単一の指標はありますか? すでに多くの解決策があるかもしれないと感じていますが、それらを検索するために使用する正しい用語がわかりません。 共分散行列の固有値を足し合わせるようなことができるかもしれませんが、それは理にかなっていますか?

1
共分散行列を変数の不確実性に変換できますか?
共分散行列介してノイズ測定値を出力するGPSユニットがありますΣΣ\Sigma。 Σ=⎡⎣⎢σxxσyxσxzσxyσyyσyzσxzσyzσzz⎤⎦⎥Σ=[σxxσxyσxzσyxσyyσyzσxzσyzσzz]\Sigma = \left[\begin{matrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{xz} & \sigma_{yz} & \sigma_{zz} \end{matrix}\right] (そこもだ関与が、聞かせてのは、第二のためにそれを無視します。)ttt 各方向()の精度が数値であることを誰かに伝えたいとします。μ X、μ Y、μ Z。言うことです。つまり、私のGPSは私の読書を与える可能性があり、X = ˉ X ± μ X、など私の理解では、つまりμこのケースでは、すべての測定量が互いに独立であることを意味し(すなわち、共分散行列が対角です)。さらに、ベクトル誤差を見つけることは、直交誤差(平方和の平方根)に誤差を追加するのと同じくらい簡単です。x,y,zx,y,zx,y,zμx,μy,μzμx,μy,μz\mu_x, \mu_y, \mu_zx=x¯±μxx=x¯±μxx=\bar{x}\pm\mu_xμμ\mu 共分散行列が対角でない場合はどうなりますか?yおよびz方向の効果を含む単純な数はありますか?与えられた共分散行列をどうやって見つけることができますか?μ∗xμx∗\mu_x^*yyyzzz

2
多変量ガウス分布の共分散事後分布の推定
サンプル数の少ない2変量ガウス分布を「学習」する必要がありますが、事前分布に関する仮説は良好なので、ベイジアンアプローチを使用したいと思います。 :私は私の前に定義された P(μ)∼N(μ0,Σ0)P(μ)∼N(μ0,Σ0) \mathbf{P}(\mathbf{\mu}) \sim \mathcal{N}(\mathbf{\mu_0},\mathbf{\Sigma_0}) μ0=[00] Σ0=[160027]μ0=[00] Σ0=[160027] \mathbf{\mu_0} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \ \ \ \mathbf{\Sigma_0} = \begin{bmatrix} 16 & 0 \\ 0 & 27 \end{bmatrix} そして、私の分布は、仮説与えられた P(x|μ,Σ)∼N(μ,Σ)P(x|μ,Σ)∼N(μ,Σ) \mathbf{P}(x|\mathbf{\mu},\mathbf{\Sigma}) \sim \mathcal{N}(\mathbf{\mu},\mathbf{\Sigma}) μ=[00] Σ=[180018]μ=[00] Σ=[180018] \mathbf{\mu} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \ \ \ \mathbf{\Sigma} = …

2
共分散構造の指定:長所と短所
GLMで共分散構造を指定することの利点は何ですか(共分散行列のすべての非対角成分をゼロとして扱うのではなく)?データについて知っていることを反映するだけでなく、 適合度を改善しますか? 保留データの予測精度を改善しますか? 共分散の程度を推定できるようにしますか? 共分散構造を課すコストはいくらですか?やる 推定アルゴリズムに計算上の複雑さを追加しますか? 推定パラメータの数を増やし、AIC、BIC、DICも増やしますか? 正しい共分散構造を経験的に決定することは可能ですか、それともデータ生成プロセスに関する知識に依存するものですか? 私が言及しなかった費用/利益はありますか?

4
1つの変数の標準偏差が0の場合、相関はどうなりますか?
私が理解しているように、方程式を使用して共分散を正規化することで相関を得ることができます ρi,j=cov(Xi,Xj)σiσjρi,j=cov(Xi,Xj)σiσj\rho_{i,j}=\frac{cov(X_i, X_j)}{\sigma_i \sigma_j} ここで、は標準偏差です。 XIσi=E[(Xi−μi)2]−−−−−−−−−−−√σi=E[(Xi−μi)2]\sigma_i=\sqrt{E[(X_i-\mu_i)^2]}XiXiX_i 私の懸念は、標準偏差がゼロに等しい場合です。ゼロにならないことを保証する条件はありますか? ありがとう。


3
変数の1つがカテゴリカルである場合、相関があまり役に立たないのはなぜですか?
これはちょっとした内臓検査です。この概念をどのように誤解しているかを確認してください。 私は相関関係の機能的理解を持っていますが、その機能的理解の背後にある原則を本当に自信を持って説明するために、ちょっとした把握を感じています。 私が理解しているように、統計的相関(用語のより一般的な使用法とは対照的に)は、2つの連続変数とそれらが同様の方法で上昇または下降する傾向があるかどうかを理解する方法です。 たとえば、1つの連続変数と1つのカテゴリ変数で相関を実行できない理由は、2つの間の共分散を計算する ことができないためです。なぜなら、定義によりカテゴリ変数は平均を求めることができず、したがって、最初の統計分析のステップ。 そうですか?

3
共分散がゼロに等しいと、バイナリ確率変数の独立性を意味しますか?
XXXとが2つの可能な状態しかとれない2つのランダム変数である場合、が独立性を意味することをどのように示すことができますか?この種のことは、が独立性を意味しないということをその日に学んだことに反します...C o v (X 、Y )= 0 C o v (X 、Y )= 0YYYCov(X,Y)=0Cov(X,Y)=0Cov(X,Y) = 0Cov(X,Y)=0Cov(X,Y)=0Cov(X,Y) = 0 ヒントは、可能な状態としてとから開始し、そこから一般化することを示しています。そして、私はそれを行うことができ、を示すことができますが、これは独立性を意味しませんか?0 E (X Y )= E (X )E (Y )111000E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY) = E(X)E(Y) これを数学的にどのように行うか混乱しているようです。

3
ARMA(2,1)プロセスの自己共分散-解析モデルの導出
次のように示されるARMA(2,1)プロセスの自己共分散関数の分析式を導出する必要があります。γ(k)γ(k)\gamma\left(k\right) yt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵtyt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵty_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\theta_1\epsilon_{t-1}+\epsilon_t だから、私はそれを知っています: γ(k)=E[yt,yt−k]γ(k)=E[yt,yt−k]\gamma\left(k\right) = \mathrm{E}\left[y_t,y_{t-k}\right] だから私は書くことができます: γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]\gamma\left(k\right) = \phi_1 \mathrm{E}\left[y_{t-1}y_{t-k}\right]+\phi_2 \mathrm{E}\left[y_{t-2}y_{t-k}\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_{t-k}\right]+\mathrm{E}\left[\epsilon_{t}y_{t-k}\right] 次に、自己共分散関数の分析バージョンを導出するには、ある整数より大きいすべてのに対して有効な再帰が得られるまで、 -0、1、2 ...の値を代入する必要があります。kkkkkkk したがって、を代入し、これを実行して以下を取得します。k=0k=0k=0 γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt]γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt] \gamma \left(0\right) = \mathrm{E}\left[y_t,y_t\right] = \phi_1 \mathrm{E}\left[y_{t-1}y_t\right] + \phi_2 \mathrm{E}\left[y_{t-2}y_t\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_t\right]+\mathrm{E}\left[\epsilon_ty_t\right]\\ これで、これらの用語の最初の2つを単純化して、前と同じように置き換えることができます。ytyty_t γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)] \gamma\left(0\right) = \phi_1 \gamma\left(1\right) + \phi_2 \gamma\left(2\right)\\ + \theta_1 \mathrm{E}\left[\epsilon_{t-1} \left(\phi_1 y_{t-1} +\phi_2 y_{t-2} +\theta_1 \epsilon_{t-1} + \epsilon_t \right)\right]\\ …


3
パラメータ化可能な共分散行列を持つ正のk次元象限上の分布は何ですか?
負のシミュレーションに関する彼の問題に関するzzkの質問に続いて、共分散行列を設定できる正のk次元象限上の分布のパラメータ化されたファミリは何であるかと思います。Rk+R+k\mathbb{R}_+^kΣΣ\Sigma zzkで説明したように、分布から開始し、線形変換しても機能しません。Rk+R+k\mathbb{R}_+^kX⟶Σ1/2(X−μ)+μX⟶Σ1/2(X−μ)+μX \longrightarrow\Sigma^{1/2} (X-\mu) + \mu

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.