ランク相関を使用した正準相関分析


15

正準相関分析(CCA)は、2つのデータセットの線形結合の通常のピアソンの積率相関(すなわち線形相関係数)を最大化することを目的としています。

これは、我々はまた、例えば、Spearman-使用する理由は非常に理由である-今、組合の直線のみの措置この相関係数があるという事実を検討またはKendall- τの間の任意のモノトーンを測定する(ランク)相関係数(必ずしも直線的ではない)の接続を変数。ρτ

したがって、私は次のことを考えていました:CCAの1つの制限は、目的関数のために、形成された線形の組み合わせ間の線形の関連付けをキャプチャしようとすることです。それが最大化することによって、ある意味でCCAを拡張することが可能ではないでしょう、Spearman-は、言う代わりPearson-ののRρr

そのような手順は、統計的に解釈可能で意味のあるものにつながりますか?(たとえば、ランクでCCAを実行することは理にかなっていますか?)非正常なデータを処理するときに役立つかどうか疑問に思っています...


4
ウィルOVERALSカノニカル相関を最大化するために、線形正準分析され、最適スケール(単調トランスフォーム)変数- -あなたの好みになりますか?
ttnphns

@ttnphns:アイデアのおかげで、私はそれを聞いたことがなく、本当に面白そうです!しかし、私はそれがポイントに対処するとは思わない:私が理解する限り、それは本質的に最適スケーリングとCCAの組み合わせです-しかし最適スケーリングはカテゴリー変数に対してのみ本当に意味があります。比率スケールで測定された連続変数では、あまり変化しないようです(これは私の心の中にあります!)。しかし、私が間違っているなら、私を修正してください。
タマスフェレンチ

1
@ttnphns:ええ、連続変数でスピアマン相関を使用するときとまったく同じ方法です!(もちろん、それは順序であるとしてデータを扱う...しかし、我々は、変数間の一般的なモノトーン(だけではなく、線形)の関連性を特徴づけるために、間違いなく連続変数にそれを使用neverthless。)私は、これは理にかなって思った理由ですそのだけでなくとしてCCA ...
タマスフェレンチ

@Glen_b、あなたは正しい。もちろん、順位相関は任意の単調性に関するものです-順序データであれ連続データであれ。上記の自分のコメントに非常に驚き、削除しています。
ttnphns

カーネルCCAを使用してみてください。特に放射基底関数で使用すると、無限次元の部分空間にデータを投影できます。
ロニ

回答:


6

正準変量を計算するときに、制限付き3次スプライン展開を使用しました。新しい機能を追加するのとまったく同じように、非線形基底関数を分析に追加しています。これにより、非線形主成分分析が行われます。例については、R Hmiscパッケージtranscan関数を参照してください。R homalsパッケージはこれをさらに進めます。


1
ありがとうございました!homalsで説明されているアプローチは、私にとっては斬新でしたが、間違いなく興味深いものでした。
タマスフェレンチ14

4

CCAの標準的な方法は、積率相関係数行列で機能します。最大のマグニチュードCCの場合、abs(correlation(z1、z2))が最大化されるように、2つの行列(n行とm1およびm2変数)の線形結合によって2つの複合変数z1(n)およびz2(n)を構築します。この目的関数は、correlation(z1、z2)が積モーメントではなく、異なる方法で定義されている場合でも、直接最大化できます。

ミシュラ、SK(2009)「2組のランキングスコアの順序正準相関分析に関するメモ」

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.