それは確かに何かです。調べるには、相関関係自体について知っていることを調べる必要があります。
ベクトル値のランダム変数の相関行列は、標準化されたバージョンの分散共分散行列または単に「分散」です。つまり、各は、再センタリングされ、再スケーリングされたバージョンに置き換えられます。X X iX=(X1,X2,…,Xp)XXi
との共分散は、中心バージョンの積の期待値です。つまり、およびと、XiX ′ i = X i − E [ X i ] X ′ j = X j − E [ X j ]XjX′i=Xi−E[Xi]X′j=Xj−E[Xj]
Cov(Xi,Xj)=E[X′iX′j].
と書くの分散は、単一の数値ではありません。値の配列 ヴァー(X)ヴァー(X )I 、J = Covを(X I、XのJ)。XVar(X)
Var(X)ij=Cov(Xi,Xj).
意図された一般化の共分散を考える方法は、それをテンソルと考えることです。これは、からまでのとでインデックス付けされた数量コレクション全体であり、その値はが線形変換を受けると特に予測可能な方法で変化することを意味します。具体的には、を別のベクトル値のランダム変数と定義します。 i j 1 p X Y = (Y 1、Y 2、… 、Y q)vijij1pXY=(Y1,Y2,…,Yq)
Yi=∑j=1pajiXj.
定数(及びあるインデックス -電力ではない)を形成アレイ、と。期待の線形性は、ajiijjq×pA=(aji)j=1,…,pi=1,…,q
Var(Y)ij=∑akialjVar(X)kl.
マトリックス表記では、
Var(Y)=AVar(X)A′.
すべてのコンポーネントは、実際には偏光アイデンティティのために単変量の分散ですVar(X)
4Cov(Xi,Xj)=Var(Xi+Xj)−Var(Xi−Xj).
これは、単変量のランダム変数の分散を理解すれば、すでに二変量変数の共分散を理解していることを示しています。それらは分散の「単なる」線形結合です。
質問の式は完全に類似しています:変数はように標準化されています。標準化されているかどうかにかかわらず、変数の意味を考慮することで、それが何を表すかを理解できます。ように、各を中央バージョンに置き換え、3つのインデックスを持つ数量を形成します。Xi(1)Xi(2)
μ3(X)ijk=E[X′iX′jX′k].
これらは次数3の中心(多変量)モーメントです。以下のように、それらはテンソルを形成する:とき、次いで(4)Y=AX
μ3(Y)ijk=∑l,m,naliamjankμ3(X)lmn.
この三重和のインデックスは、からまでの整数のすべての組み合わせに及びます。1p
偏光アイデンティティの類似物は
24μ3(X)ijk=μ3(Xi+Xj+Xk)−μ3(Xi−Xj+Xk)−μ3(Xi+Xj−Xk)+μ3(Xi−Xj−Xk).
右側では、は(単変量)中央の3次モーメント、つまり中心変数の立方体の期待値を指します。変数が標準化されている場合、この瞬間は通常歪度と呼ばれます。したがって、我々は考えることができるであるとして、多変量歪度の。これは、ランク3(つまり、3つのインデックス)のテンソルであり、その値は、さまざまな和と差の歪度の線形結合です。解釈を求める場合、これらのコンポーネントは、歪度が1次元で測定されている場合でも、次元で測定されると考えます。多くの場合、μ3μ3(X)XXip
最初の瞬間は、分布の場所を測定します。
二次モーメント(分散共分散行列)はその広がりを測定します。
標準化された2次モーメント(相関)は、次元空間での広がりの変化を示します。そしてp
標準化された3番目と4番目のモーメントは、その広がりに対する分布の形状を測定するために使用されます。
多次元の「形状」の意味を詳しく説明すると、多変量分布を原点にあり、すべての方向に均等に広がる標準バージョンに減らすメカニズムとしてPCAを理解できることがわかりました。PCAが実行された後、は分布の多次元形状の最も単純なインジケーターを提供します。データは経験的分布の観点から常に分析できるため、これらのアイデアはランダム変数に関してもデータに等しく適用されます。μ3
参照
アラン・スチュアート&J.キース・オード、ケンダル統計統計の 第5版、第1巻:分布理論。第3章、モーメントとキュムラント。オックスフォード大学出版局(1987)。
付録:偏光アイデンティティの証明
ましょう代数的変数です。ありすべての加算および減算する方法それらのは。これらの和と差のそれぞれを乗して、それらの結果のそれぞれに適切な符号を選択し、それらを加算すると、倍数が得られます。x1,…,xn2nnnthx1x2⋯xn
より正式には、をのすべてのタプルのセットとし、任意の要素がベクトルその係数はすべてです。クレームはS={1,−1}nn±1s∈Ss=(s1,s2,…,sn)±1
2nn!x1x2⋯xn=∑s∈Ss1s2⋯sn(s1x1+s2x2+⋯+snxn)n.(1)
実際、多項定理は、右辺の任意の項の展開において、単項式(は合計する非負の整数)の係数側は i j nxi11xi22⋯xinnijn
(ni1,i2,…,in)si11si22⋯sinn.
要するに、関係する係数各対の一方は、ケース含むペアで現れる係数に比例すると、 回等しいです、及び各対の他方はケース含む、係数比例とに倍に等しい。が奇数の場合、合計でキャンセルされます。同じ引数が適用されます。その結果、(1)xi11s1=1s1si111s1=−1−1(−1)i1(−1)i1+1i1+1i2,…,in非ゼロ係数で発生する唯一の単項式は、すべての奇数乗でなければなりません。xi そのような単項式はです。係数すべての項で。その結果、その係数は、QED。x1x2⋯xn(n1,1,…,1)=n!2n2nn!
関連付けられた各ペアの半分のみを取得する必要があります。つまり、右側を項に制限し、左側の係数を半分にすることができます。これは、と場合について、この回答で引用されている偏光IDの2つのバージョンを正確に示しています:と。x1(1)s1=12n−1n!n=2n=322−12!=423−13!=24
もちろん、代数変数の偏光恒等式は、ランダム変数に対して即座にそれを暗示します。各ランダム変数ます。双方の期待に応えます。結果は期待の線形性に従います。xiXi