共分散行列のメトリック:欠点と長所


11

共分散行列の「最良の」メトリックスは何ですか、そしてなぜですか?Frobenius&cは適切ではなく、角度のパラメーター化にも問題があることは明らかです。直感的にこれらの2つの間の妥協を望むかもしれませんが、心に留めておくべき他の側面やおそらく確立された標準があるかどうかも知りたいです。

共通メトリックは、共分散行列にとって自然ではないため、さまざまな欠点があります。たとえば、非PSD行列に特にペナルティを課したり、ランクに対して適切に動作しないことがよくあります(2つの回転した低ランク共分散楕円体を考えてください:同じです) -コンポーネントの平均よりも距離が短くなるように中間回転をランク付けします。これは、やおそらくフロベニウスには当てはまりません。ここで修正してください)。また、凸性は必ずしも保証されていません。これらの問題やその他の問題を「良い」指標で対処するのは良いことです。L1

ここではいくつかの問題の良い議論、あるネットワーク最適化の一例コンピュータビジョンの一つが。そして、ここに他のいくつかのメトリックを取得するが議論なしの同様の質問があります。


2
求めるメトリックの目的は何ですか?フロベニウスの測定基準は何に不適切ですか?
whuber

1
L1

あなたが「より制限された」と言及する最後の質問はどうですか?結局のところ、すべての共分散行列は対称です。完全な複製のようです。
whuber

1
それは他の質問に対する良い批判です。最後のコメントの内容を反映するように質問(およびタイトル)を編集することをお勧めしますか?これにより、見かけ上の重複と明確に区​​別され、回答者がより適切な返信を提供できるようになります。(そして、あなた自身の質問の編集について心配しないでください。それは予想されます。メタスレッドは主にコミュニティ編集に関するものです。)
whuber

1
@kjetilbhalvorsenそれは挑発的な文章です!答えを広げていただけませんか?または記事の参照を提供しますか?
Sycoraxは、モニカを復活させると2014

回答:


2

まあ、私は共分散行列を分析するための良いメトリックまたは「最良の方法」はないと思います。分析は常に目標に沿ったものでなければなりません。Cが私の共分散行列であるとしましょう。対角線には、計算された各パラメーターの分散が含まれます。したがって、パラメータの重要性に関心がある場合は、全体的なパフォーマンスであるため、trace(C)が適切な出発点となります。

パラメータとその重要性をプロットすると、次のようになります。

x1 =  1.0 ±  0.1 
x2 = 10.0 ±  5.0
x3 =  5.0 ± 15.0 <-- non-significant parameter

あなたがそれらの相互相関に興味があるなら、そのようなテーブルは興味深いものをもたらすかもしれません:

x1  1.0
x2  0.9  1.0
x3 -0.3 -0.1  1.0
    x1    x2   x3

各要素は、パラメーターxiとxjの間の相関係数です。この例から、パラメーターx1とx2は高い相関関係にあることがわかります。


1

興味深い質問ですが、私は現在同じ問題に取り組んでいます!それは、どのように「最良」を定義するかに依存します。つまり、スプレッドの平均値、またはデータ間の相関関係などを探しますか。私はPress、SJ(1972):Applied Multivariate Analysis、 p。108共分散行列の行列式として定義される一般化された分散は、拡散の単一の指標として有用です。しかし、それがあなたの後にある相関関係であるなら、私はさらに考える必要があります。お知らせ下さい。


3
参考にしてください。
Nick Cox
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.