数百の測定値があります。今、私は何らかのソフトウェアを利用して、すべてのメジャーをすべてのメジャーに関連付けることを検討しています。これは、数千の相関があることを意味します。これらの中には、データが完全にランダムである場合でも(統計的に)高い相関があります(各メジャーには約100個のデータポイントしかありません)。
相関関係を見つけた場合、相関関係を探したときの情報をどのように含めることができますか?
私は統計のレベルが高いわけではありませんので、ご容赦ください。
R
このマシン上では、300 100により行列の最大相関係数のヌル順列分布1000の実現を得るために18秒を要するx
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))