タグ付けされた質問 「covariance-matrix」

k×k確率変数のすべてのペア間の共分散の行列。これは、分散共分散行列または単に共分散行列とも呼ばれます。 k

3
lmerの分散共分散行列
混合モデルの利点の1つは、データの分散共分散行列(化合物の対称性、自己回帰、非構造化など)をlmer指定できることです。ただし、Rの関数ではこの行列を簡単に指定できません。lmerデフォルトでどの構造が使用されているのか、それを簡単に指定する方法がない理由を誰もが知っていますか?

1
外れ値検出のための堅牢なPCAと堅牢なマハラノビス距離
堅牢なPCA(Candes et al 2009またはNetrepalli et al 2014 によって開発された)は多変量異常値検出の一般的な方法ですが、マハラノビス距離は、共分散行列の堅牢で正規化された推定値が与えられると、異常値検出にも使用できます。私は、あるメソッドを他のメソッドよりも使用することの(不利な)利点に興味があります。 私の直感では、2つの最大の違いは次のとおりであることがわかります。データセットが(統計的な意味で)「小さい」場合、ロバストPCAは低いランクの共分散を提供し、代わりにロバストな共分散行列推定は完全なLedoit-Wolf正則化によるランク共分散。これはどのように異常値の検出に影響しますか?

1
共分散行列のランクが最大
この質問で述べたように、共分散行列の最大ランクはで、はサンプルサイズです。したがって、共分散行列の次元がサンプルサイズに等しい場合、それは特異です。共分散行列の最大ランクからを引く理由がわかりません。n − 1n−1n-1nnn111nnn

3
主成分分析の「後方」:データの分散は、変数の与えられた線形結合によってどの程度説明されますか?
6つの変数、、、、、主成分分析を実行しました。正しく理解すれば、回転していないPC1はこれらの変数の線形結合がデータの最大の分散を説明/説明し、PC2はこれらの変数の線形結合がデータの次に大きな分散を説明するなどを教えてくれます。AAABBBCCCDDDEEEFFF 私はちょうど興味があります-この「後方」を行う方法はありますか?これらの変数の線形結合を選択するとしましょう。たとえば、場合、これが記述するデータの分散を計算できますか?A+2B+5CA+2B+5CA+2B+5C

5
共分散行列からの「分散」の尺度?
データが1dの場合、分散はデータポイントが互いに異なる程度を示します。データが多次元の場合、共分散行列を取得します。 多次元データの場合、一般にデータポイントが互いにどのように異なるかを示す単一の指標はありますか? すでに多くの解決策があるかもしれないと感じていますが、それらを検索するために使用する正しい用語がわかりません。 共分散行列の固有値を足し合わせるようなことができるかもしれませんが、それは理にかなっていますか?



1
曲線近似から共分散行列を解釈するにはどうすればよいですか?
私は統計があまり得意ではないので、これが単純な質問であればおifびします。一部のデータに曲線を当てはめていますが、データがの形の負の指数関数に最適な場合があり、a ∗ e (− b ∗ x 2)に近い場合があります+ C。ただし、これらの両方が失敗する場合があり、線形フィットにフォールバックしたいと思います。私の質問は、どのモデルが特定のデータセットに最も適合するかを、結果の分散共分散行列から最適に決定する方法です。a ∗ e(− b ∗ x )+ ca∗e(−b∗バツ)+ca * e^{(-b * x)} + ca ∗ e(− b ∗ x2)+ ca∗e(−b∗バツ2)+ca * e^{(-b * x^2)} + cscipy.optimize.curve_fit()関数?分散はこの行列の対角線の1つにあると思いますが、どのように解釈するのかわかりません。 更新:同様の質問に基づいて、分散共分散行列が、3つのモデルのうちどれがデータに最も適合するかを教えてくれることを期待しています(これら3つのモデルの1つに多くのデータセットを適合させようとしています)。 結果の行列は、指定された例では次のようになります。 pcov_lin [[ 2.02186921e-05 -2.02186920e-04] [ -2.02186920e-04 2.76322124e-03]] pcov_exp [[ 9.05390292e+00 -7.76201283e-02 -9.20475334e+00] [ -7.76201283e-02 …

1
ゲルマンとルービンの収束診断、ベクトルで動作するように一般化する方法は?
Gelman and Rubin診断は、並行して実行される複数のmcmcチェーンの収束を確認するために使用されます。チェーン内の分散をチェーン間分散と比較します。説明は以下のとおりです。 ステップ(パラメーターごと): 過分散した開始値から長さ2nのm≥2チェーンを実行します。 各チェーンの最初のn個のドローを破棄します。 チェーン内およびチェーン間分散を計算します。 チェーン内およびチェーン間分散の加重和として、パラメーターの推定分散を計算します。 潜在的な縮尺率を計算します。 リストアイテム この統計を使用したいのですが、使用したい変数はランダムなベクトルです。 この場合、共分散行列の平均を取ることは理にかなっていますか?

1
ツインスタディデータによる線形混合効果モデリング
i番目の家族のj番目の兄弟から測定されたいくつかの応答変数yijyijy_{ij}があるとします。さらに、各被験者からいくつかの行動データx i jが同時に収集されました。次の線形混合効果モデルを使用して状況を分析しようとしています。jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} ここで、α0α0\alpha_0とα1α1\alpha_1、それぞれ固定切片と傾きであり、 δ1iδ1i\delta_{1i}ランダム傾きであり、εijεij\varepsilon_{ij}残差です。 ランダム効果のための前提条件は、δ1iδ1i\delta_{1i}及び残留εijεij\varepsilon_{ij}(各ファミリー内の2つだけの兄弟が存在すると仮定されます) δ1i(εi1,εi2)T∼dN(0,τ2)∼dN((0,0)T,R)δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T &\stackrel{d}{\sim} N((0, 0)^T, R) \end{align} ここで、未知の分散パラメータであり、分散共分散構造Rは、フォームの2×2対称行列でありますτ2τ2\tau^2RRR (r21r212r212r22)(r12r122r122r22)\begin{pmatrix} r_1^2&r_{12}^2\\ r_{12}^2&r_2^2 \end{pmatrix} 2人の兄弟間の相関関係をモデル化します。 これは、そのような兄弟研究に適したモデルですか? データは少し複雑です。50の家族のうち、90%近くが二卵性(DZ)双生児です。残りの家族のために、 2人は兄弟が1人だけです。 2つには1つのDZペアと1つの兄弟があります。そして 2つには1つのDZペアと2つの追加の兄弟があります。 lmeRパッケージnlmeは、(1)不足または不均衡な状況でも簡単に処理できると考えています。私の問題は、(2)と(3)の対処方法です。私が考えることができる1つの可能性は、各サブファミリーが1つまたは2つの兄弟を持つように(2)および(3)のこれらの4つのファミリーのそれぞれを2つに分割して、上記のモデルを適用できるようにすることです。これでいいですか?もう1つの選択肢は、(2)と(3)の余分な1つまたは2つの兄弟からデータを単に破棄することです。これは無駄であると思われます。より良いアプローチはありますか? たとえば、r 2 12 = 0.5のように、残差分散共分散行列Rlmeの値を修正できるようです。相関構造を課すことは理にかなっていますか、それとも単にデータに基づいて推定する必要がありますか?rrrRRRr212r122r_{12}^2


1
ガウス混合モデルの異なる共分散タイプ
ここでガウス混合モデルを試してみたところ、これら4種類の共分散が見つかりました。 'full' (each component has its own general covariance matrix), 'tied' (all components share the same general covariance matrix), 'diag' (each component has its own diagonal covariance matrix), 'spherical' (each component has its own single variance). 私は、これらの各タイプの詳細を見つけるために多くのことをGoogleで検索しますが(のような非常に高いレベルの説明見つかっこれのみ)。 誰かが私にこれらを理解するのを手伝ってくれるか、少なくとも私がこれらについて読むことができるどこかに私を導くことができるならば、感謝します。

2
ベイジアン最適化のためのGP回帰における不良条件共分散行列
背景と問題 回帰とその後のベイズ最適化(BO)にガウス過程(GP)を使用しています。回帰の場合、MATLABでgpmlパッケージを使用し、いくつかのカスタムメイドの変更を加えますが、問題は一般的です。 2つのトレーニング入力が入力空間内で近すぎる場合、共分散行列が非正定値になる可能性があることはよく知られています(このサイトにはいくつかの質問があります)。その結果、さまざまなGP計算に必要な共分散行列のコレスキー分解は、数値誤差により失敗する場合があります。これは、私が使用している目的関数でBOを実行したときにいくつかのケースで発生し、修正したいと思います。 提案されたソリューション 悪条件を緩和するための標準ソリューションであるAFAIKは、共分散行列の対角線にリッジまたはナゲットを追加することです。GP回帰の場合、これは観測ノイズの追加(または、既に存在する場合は増加)に相当します。 ここまでは順調ですね。コードを修正してgpmlを正確に推論し、コレスキー分解が失敗するたびに、ジョンD' Errico によるこのMATLABコードに触発されたフロベニウスノルムの最も近い対称正定(SPD)行列に共分散行列を修正しようとします。理論的根拠は、元のマトリックスへの介入を最小限にすることです。 この回避策は仕事をしますが、いくつかの機能でBOのパフォーマンスが大幅に低下することに気付きました-おそらくアルゴリズムが特定の領域にズームインする必要があるときはいつでも(たとえば、最小に近づくか、長さのスケールのため問題の不均一に小さくなります)。2つの入力ポイントが近づきすぎるとノイズが効果的に増加するため、この動作は理にかなっていますが、もちろん理想的ではありません。または、問題のあるポイントを削除することもできますが、繰り返しますが、入力ポイントを近づける必要がある場合があります。 質問 GPの共分散行列のコレスキー因数分解に関する数値的な問題は新しい問題ではないと思いますが、驚いたことに、ノイズを増やしたり、互いに近すぎる点を削除したりすることを除けば、これまでのところ多くの解決策を見つけることができませんでした。一方で、私の機能のいくつかは非常に悪い振る舞いをしているので、おそらく私の状況はそれほど典型的ではありません。 ここで役立つ可能性のある提案/参照はありますか?

2
分散共分散行列の解釈
線形モデルがModel1ありvcov(Model1)、次の行列を与えると仮定します。 (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 この例では、このマトリックスは実際に何を表示しますか?モデルとその独立変数に対して安全に行える仮定は何ですか?

2
2つの共分散行列の合計と積も共分散行列ですか?
共分散行列とYがあるとします。これらのオプションのどれが共分散行列でもありますか?バツXXYYY バツ+ YX+YX+Y バツ2X2X^2 バツYXYXY 何かが共分散行列になるために正確に何が必要かを理解するのに少し問題があります。たとえば、、およびY = cov (Y 1、Y 2)の場合、1がtrueになるには、cov (X 1、X 2)+ cov (Y 1、Y 2)= cov (Z 1、バツ= cov(X1、X2)X=cov⁡(X1,X2)X=\operatorname{cov}(X_1,X_2)Y= cov(Y1、Y2)Y=cov⁡(Y1,Y2)Y=\operatorname{cov}(Y_1,Y_2)、ここで Z 1と Z 2は他の確率変数です。ただし、3つのオプションのいずれにも当てはまる理由がわかりません。どんな洞察も認められます。cov(X1、X2)+ cov(Y1、Y2)= cov(Z1、Z2)cov⁡(X1,X2)+cov⁡(Y1,Y2)=cov⁡(Z1,Z2)\operatorname{cov}(X_1,X_2) + \operatorname{cov}(Y_1,Y_2) = \operatorname{cov}(Z_1, Z_2)Z1Z1Z_1Z2Z2Z_2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.