タグ付けされた質問 「covariance」

共分散は、2つの変数間の線形関係の強さと方向を測定するために使用される量です。共分散はスケーリングされていないため、しばしば解釈が困難です。変数のSDでスケーリングすると、ピアソンの相関係数になります。

10
平均のみを理解している人に共分散をどのように説明しますか?
...分散についての知識を直感的に増やすことができると仮定して(「分散」を直感的に理解する)、または「平均」からのデータ値の平均距離であり、分散は平方であるため単位、平方根を使用して単位を同じに保ちます。これは標準偏差と呼ばれます。 これが「レシーバー」によって明確に表現され、(できれば)理解されると仮定しましょう。共分散とは何ですか?数学用語/式を使用せずに単純な英語でどのように説明しますか?(つまり、直感的な説明。;) 注意してください:私は概念の背後にある式と数学を知っています。私は、数学を含めずに、同じことを分かりやすい方法で「説明」できるようにしたいと考えています。すなわち、「共分散」とはどういう意味ですか?


6
相関と共分散の違いをどのように説明しますか?
この質問に続いて、平均のみを理解している人に共分散をどのように説明しますか?、素人に共分散を説明する問題に対処し、私の心の中で同様の質問を持ち出しました。 共分散と相関の違いを統計初心者にどのように説明しますか?どちらも別の変数にリンクされている1つの変数の変更を参照しているようです。 言及された質問と同様に、式の欠如が望ましいでしょう。


9
正規化と機能のスケーリングはどのようにそしてなぜ機能しますか?
多くの機械学習アルゴリズムは、平均相殺と共分散等化でより良く機能することがわかります。たとえば、ニューラルネットワークはより速く収束する傾向があり、K-Meansは通常、前処理された機能を使用してより良いクラスタリングを提供します。これらの前処理ステップの背後にある直感がパフォーマンスの向上につながるとは思いません。誰かがこれを私に説明できますか?

4
共分散と独立性?
私は教科書から、はXとYが独立していることを保証しないと読みました。しかし、それらが独立している場合、それらの共分散は0でなければなりません。適切な例はまだ考えられません。誰かがそれを提供できますか?cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0


2
共分散行列の逆数はデータについて何と言っていますか?(直感的に)
の性質に興味があります。「がデータについて何と言っているか」について、誰でも直観的に話せますか?Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} 編集: 返信ありがとう いくつかの素晴らしいコースを受講した後、いくつかのポイントを追加したいと思います。 つまり、は方向沿った情報量です。xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx 双対性:のでそうである、正定である、我々は正則化最小二乗問題のためFenchelデュアルを導き出すことができるように、彼らはドット積規範ですので、より正確に、彼らはお互いのデュアル規範あり、二重問題の最大化を行います。条件に応じて、どちらかを選択できます。ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1} ヒルベルト空間:と列(および行)は同じ空間にます。したがって、または表現の間に利点はありません(これらの行列のいずれかが悪条件の場合)Σ−1Σ−1\Sigma^{-1}ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1}ΣΣ\Sigma ベイジアン統計:ノルムは、ベイジアン統計で重要な役割を果たします。それは我々が前に持っているどのくらいの情報決定すなわち、例えば、前の密度の共分散が似ているとき 我々は(前またはおそらくジェフリーズ)非有益持っていますΣ−1Σ−1\Sigma^{-1}∥Σ−1∥→0‖Σ−1‖→0\|\Sigma^{-1}\|\rightarrow 0 頻度統計: Cramér–Raoバウンドを使用して、フィッシャー情報と密接に関連しています。実際、フィッシャー情報マトリックス(対数尤度とそれ自体の勾配の外積)は、Cramér–Raoによってバインドされています。つまり、Σ−1⪯FΣ−1⪯F\Sigma^{-1}\preceq \mathcal{F}(wrt正半正円錐、iewrt濃度)楕円体)。したがって、Σ−1=FΣ−1=F\Sigma^{-1}=\mathcal{F}の場合、最尤推定量は効率的です。つまり、データに最大の情報が存在するため、頻度主義体制が最適です。簡単な言葉で言えば、いくつかの尤度関数(尤度の関数形式は、データを生成する推定モデル、別名生成モデルに純粋に依存することに注意)の場合、最尤法は効率的で一貫した推定量であり、ボスのようなルールです。(それをやりすぎて申し訳ありません)

6
共分散推定量の分母がn-1ではなくn-2にならないのはなぜですか?
(不偏)分散推定量の分母はであり、観測値があり、推定されるパラメーターは1つだけです。n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} 同様に、2つのパラメーターを推定するときに共分散の分母をにしないのはなぜでしょうか?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}


3
共分散行列の反転が確率変数間の部分相関をもたらすのはなぜですか?
ランダム変数間の偏相関は、共分散行列を反転し、そのような結果の精度行列から適切なセルを取得することで見つけることができると聞きました(この事実は http://en.wikipedia.org/wiki/Partial_correlationにいますが、証拠はありません) 。 これはなぜですか?

4
最尤法を使用して多変量正規モデルを近似するときに共分散行列のプロパティを保証する方法は?
私は次のモデルを持っているとします yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i ここで、、 は説明変数のベクトル、は非線形関数およびのパラメーターです。ここで当然行列。X I θ F ε I〜N (0 、Σ )Σ K × Kyi∈RKyi∈RKy_i\in \mathbb{R}^Kxixix_iθθ\thetafffεi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma)ΣΣ\SigmaK×KK×KK\times K 目標は、およびを推定することです。明白な選択は最尤法です。このモデルの対数尤度(サンプルがあると仮定)は次のようになりますΣ (Y iは、X I)、iは= 1 、。。。、nθθ\thetaΣΣ\Sigma(yi,xi),i=1,...,n(yi,xi),i=1,...,n(y_i,x_i),i=1,...,n l(θ,Σ)=−n2log(2π)−n2logdetΣ−∑i=1n(yi−f(xi,θ))′Σ−1(y−f(xi,θ)))l(θ,Σ)=−n2log⁡(2π)−n2log⁡detΣ−∑i=1n(yi−f(xi,θ))′Σ−1(y−f(xi,θ)))l(\theta,\Sigma)=-\frac{n}{2}\log(2\pi)-\frac{n}{2} \log\det\Sigma-\sum_{i=1}^n(y_i-f(x_i,\theta))'\Sigma^{-1}(y-f(x_i,\theta))) これは簡単に思えますが、対数尤度が指定され、データが入力され、非線形最適化のために何らかのアルゴリズムが使用されます。問題は、ΣΣ\Sigmaが正定であることを確認する方法です。たとえばoptimR(またはその他の非線形最適化アルゴリズム)で使用しても、ΣΣ\Sigmaが正定であることは保証されません。 質問は、ΣΣ\Sigmaが確実に正定値を維持するようにする方法ですか?次の2つの解決策があります。 Rが上三角行列または対称行列である場合、RRとしてΣΣ\Sigmaを 再設定します。その場合、\ Sigmaは常に正定値になり、Rは制約なしになります。RR′RR′RR'RRRΣΣ\SigmaRRR プロファイル尤度を使用します。およびの式を導き出します。いくつかのから開始して、、収束するまで。θ^(Σ)θ^(Σ)\hat\theta(\Sigma)Σ^(θ)Σ^(θ)\hat{\Sigma}(\theta)θ0θ0\theta_0Σ^j=Σ^(θ^j−1)Σ^j=Σ^(θ^j−1)\hat{\Sigma}_j=\hat\Sigma(\hat\theta_{j-1})θ^j=θ^(Σ^j−1)θ^j=θ^(Σ^j−1)\hat{\theta}_j=\hat\theta(\hat\Sigma_{j-1}) 他の方法はありますか?これらの2つのアプローチはどうですか?それらは機能しますか?それらは標準ですか?これはかなり標準的な問題のように思えますが、クイック検索では何の指針も得られませんでした。ベイジアン推定も可能であることは知っていますが、当面はそれを行いたくありません。

3
非正定共分散行列はデータについて何を教えてくれますか?
多くの多変量観測値があり、すべての変数の確率密度を評価したいと思います。データは正規分布していると想定されます。変数の数が少ない場合、すべてが期待どおりに機能しますが、より大きな数に移動すると、共分散行列が非正定値になります。 Matlabの問題を次のように減らしました: load raw_data.mat; % matrix number-of-values x number of variables Sigma = cov(data); [R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf. err> 0の場合、シグマは正定ではありません。 より高い次元で実験データを評価するためにできることはありますか?それは私のデータについて有用なことを教えてくれますか? 私はこの分野の初心者ですが、明らかな何かを見逃してしまった場合はおologiesびします。

2
距離共分散が線形共分散より適切でない場合
私は(漠然と)ブラウン/距離共分散/相関について紹介されました。これは、依存関係をテストするときに、多くの非線形の状況で特に役立つようです。ただし、非線形/カオスデータには共分散/相関がよく使用されますが、あまり使用されていないようです。 距離の共分散にはいくつかの欠点があるかもしれないと考えています。それでは、それらは何であり、なぜ誰もが常に距離共分散を使用しないのですか?

2
線形変換後のランダムベクトルの共分散
場合ランダムベクトルであり、Aが固定された行列で、誰かが説明できる理由C O V [ A Z ] = A 、C 、O V [ Z ] A ⊤。ZZ\mathbf {Z}AAAcov[AZ]=Acov[Z]A⊤.cov[AZ]=Acov[Z]A⊤.\mathrm{cov}[A \mathbf {Z}]= A \mathrm{cov}[\mathbf {Z}]A^\top.
20 covariance 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.