相関行列が正の半正である必要があるのはなぜですか?また、正の半正であるかどうかはどういう意味ですか?


34

私は、相関行列または共分散行列の正の半正特性の意味を研究しています。

私は上の情報を探しています

  • 正の半正定性の定義;
  • その重要な特性、実用的な意味;
  • 負の決定要因を持つことの結果、多変量解析やシミュレーション結果への影響など。

5
半正定性とは何か、または相関行列が半正定値である必要がある理由を知りたいですか、またはこのプロパティによって暗示される重要な結果を知りたいですか?
whuber

4
相関行列が半正定ではない場合、負の分散を取得できます。

あなたの質問を少し編集しました。確認してください。また、偶数の負の固有値を持つ行列は、依然として正の行列式を持つことに注意してください。
-ttnphns

共分散行列は常に相関行列と等しいとは限りません!共分散は正規化された変数を考慮しますが、相関行列は考慮しません。
マノジクマール

1
関連質問:すべての共分散行列は正定ですか?相関行列が特別なケースである共分散行列のより広いケースを考慮します。また、すべての相関行列は半正定値ですか?そして、すべての相関行列の正定値はですか?
シルバーフィッシュ

回答:


38

加重和の分散確率変数のは、実数の全ての選択肢について非負でなければならない。分散は次のように表すことができるので、 VAR Σ I A 、I X 、I = Σ I Σ J A 、I A J COV X IX J= Σ I Σ J A I 、A J Σ I JiaiXiai

var(iaiXi)=ijaiajcov(Xi,Xj)=ijaiajΣi,j,
我々は、共分散行列ことを持っている(時には明確な非負と呼ばれている)半正値でなければなりません。行列のことを思い出しCは半正定値場合にだけ呼ばれるΣ I Σ jの A I 、A J C I J0Σ=[Σi,j]C
jaajCj0aajR

おかげで、私は下票を削除しましたが、実際的な意味については答えていないので、上票しませんでした。(「専門家」による修飾の例が原因で)正定でない行列があるとします。データのキャリブレーションやシミュレーションに使用するとどうなりますか?具体的には、これは大きな合計を研究しようとするときに実際の問題であり、負の固有値がいくつかありますか?非正の半正相関行列を正の半正行列に変換する効率的なアルゴリズムは何でしょうか?このアルゴリズムの影響は何ですか?
lcrmorin

@Were_cat投票権の取り消しをありがとう。
ディリップサルワテ

最初の方程式の最初の平等について説明してください。
ビベックスブラマニアン

1
@VivekSubramanian Varianceは、共分散関数の特殊なケースです:あり、共分散関数は双線形です(つまり、各引数に関する線形関数です:cov i a i X iY varバツ=covバツバツ
covaバツY=acovバツYcovバツbjYj=jbjcovバツYj

18

答えは非常に簡単です。

したがって、相関行列は次のように定義されます。

バツ=[バツ1バツ2バツn]m×nmn

バツb=[バツ1μ1es1バツ2μ2es2バツ3μ3es3]μ1μ2s1e

相関行列は

C=バツbバツb

AzzAz<0

CwCw<0

wCw=wバツbバツbw=バツbwバツbw=z12+z22z=バツbwwCw

うんVV


2
これは、明らかに最も簡潔で有用な答えです。ありがとう!
ヨハンオバディア

12

(推論の可能性のあるゆるみは私のものです。私は数学者ではありません。これは描写であり、証明ではなく、本からではなく数値実験からです。)

  1. 半正定値もグラム行列と呼ばれる(PSD)行列は、負の固有値を持つ行列です。負の固有値をもつ行列は、正の半正または非グラミアンではありません。これらは両方とも、明確(ゼロの固有値なし)または特異(少なくとも1つのゼロの固有値を持つ)にすることができます。[「グラミアン」という言葉は数学でいくつかの異なる意味で使用されるため、おそらく避けるべきです。]
  2. 統計では、通常、これらの用語をスカラー積行列とも呼ばれるSSCPタイプの行列に適用します。相関行列または共分散行列は、そのような行列の特定のケースです
  3. npppnnケース間の共分散行列。実際のデータから計算すると、行列は常にグラミアンになります。(1)直接測定された類似度マトリックス(データから計算されていない)、または類似度測定がSSCPタイプでない場合、非グラミアン(非psd)マトリックスを取得できます。(2)マトリックス値が誤って入力された。(3)行列は実際にはグラミアンですが、固有値を計算するスペクトル法では、真のゼロまたは小さな正の値の代わりに小さな負の値を生成することがあるため、特異です(またはそれに近い)。
  4. d122=h12+h222s12shバツYdバツy2=σバツ2+σy22covバツy
  5. mm
  6. mmm
  7. 非グラミアン(非ユークリッド)構成の考えられる原因またはバージョンは何ですか?答えは熟考の後に続きます[ポイント4]。
    • mmd
    • hddhh
    • dhh1+h2d12|h1h2|
  8. |covj|>σσj

図1。

図1

図2。

図2

図3。

図3


2
ポイント6はデモンストレーションが必要です:ユークリッド距離の2乗の行列がpdであることを示しましたが、各pd行列がポイントのユークリッド構成に対応することを証明せずに主張します。また、pdの定義(「負の固有値なし」)を後続の特性化に関連付けていません。重要なアイデアは最後にあります(ポイント8):pdマトリックスを使用して距離を定義できます。論理的には、ここから分析を開始する必要があります。
whuber

@whuber:重要な評価をありがとう。何かを数学的に証明することになると、私は沈みます。私は実際の経験の一部を報告しました(私はそれを言いました); 答えは実際には分析シーケンスではありませんでした。その場合、私のものを修正/改善できる独自の答えを追加しませんか?貴重な助けになるかもしれません。または、もしあなたがそれが完全に無駄でないと思うならば、あなたはそれを改善するために私のテキストに自由に取り組んでいます。
ttnphns

PS私のポイント8は、ダブルセンタリングがポイントの構成をその重心に固定するため、この操作自体は非ユークリッドを導入しないことを意味します(新しいポイント、センターは同じ空間に属するため、特異点のみを減少させます)。そこで、初期構成がユークリッドかどうかを確認できます。それは間違っていますか?
ttnphns
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.