環境:
2つの反復測定実験条件(n = 200)のそれぞれで6つの数値変数が測定される研究があります。条件を呼び出しましょうおよびと変数および。理論的には、条件では、変数の分散が主成分分析(PCA)の最初の要素によって説明されるはずだと私は予想しています。
一般的な値は次のとおりです。
- のPCAの第1因子は、分散の30%を占めます
 - のPCAの第1因子は 、分散の40%を占めます。
 
質問:
- この違いが統計的に有意であるかどうかをどのようにテストできますか?
 - これはどのようにRに実装できますか?
 
2つの反復測定実験条件(n = 200)のそれぞれで6つの数値変数が測定される研究があります。条件を呼び出しましょうおよびと変数および。理論的には、条件では、変数の分散が主成分分析(PCA)の最初の要素によって説明されるはずだと私は予想しています。
一般的な値は次のとおりです。
回答:
正解しましたか?-2つの条件の間に統計的に有意な差があるかどうかをテストしますか?
Perhabs vegan :: adonis()はあなたのためのものですか?それがあなたの探しているものかどうかわからない。
これは距離行列で機能し、条件内の距離が条件間よりも大きいことを比較します。たとえば、NMDSでは、2つの条件が明確に分離されています。
ここにいくつかのサンプルコードがあります:
df <- data.frame(cond = rep(c("A", "B"), each = 100), 
 v1 <- jitter(rep(c(20, 100), each = 100)),
 v2 <- jitter(rep(c(0, 80), each = 100)),
 v3 <- jitter(rep(c(40, 5), each = 100)),
 v4 <- jitter(rep(c(42, 47), each = 100)),
 v5 <- jitter(rep(c(78, 100), each = 100)),
 v6 <- jitter(rep(c(10, 100), each = 100)))
# PCA
require(vegan)
pca <- rda(df[ ,-1], scale = TRUE)
ssc <- scores(pca, display = "sites")
ordiplot(pca, type = "n")
points(ssc[df$cond == "A", ], col = "red", pch = 16)
points(ssc[df$cond == "B", ], col = "blue", pch = 16)
# NMDS
nmds <- metaMDS(df[ ,-1], distance = "euclidian")
nmsc <- scores(nmds, display = "sites")
ordiplot(nmds, type = "n")
points(nmsc[df$cond == "A", ], col = "red", pch = 16)
points(nmsc[df$cond == "B", ], col = "blue", pch = 16)
# use adonis to test if there is a difference between the conditions
adonis(df[ ,-1] ~ df[ ,1], method = "euclidean")
## There is a statistically significant difference between the two conditions
              帰無仮説を直接検定するには、順列検定を使用します。
最初のPCを状態にしましょう 説明する 分散の状態、および状態の最初のPC 説明する 分散の。あなたの仮説は、定義できるので 興味のある統計として、そして仮説は 。棄却する帰無仮説は。
順列テストを実行するには、 両方の条件からのサンプル、およびそれらを条件にランダムに分割 そして 。分割はランダムであるため、その後の説明付き分散に違いはありません。順列ごとに、計算できます、このプロセスを何度も繰り返します(たとえば、 )回、そしての分布を取得 の帰無仮説の下で 。の経験値の比較 この分布では、 -値。
の信頼区間を取得するには 、ブートストラップを使用します。
ブートストラップアプローチでは、ランダムに選択します の既存のサンプルを置き換えたサンプル そして別の から 。計算する、それを何度も繰り返します(ここでも、 )回。のブートストラップされたディストリビューションを取得します 値、およびそのパーセンタイル間隔は、経験値の信頼区間に対応します 。だからあなたは推定することができますこの分布のどの部分が上にあるかを調べることによる価値 。
順列テストは、帰無仮説をテストするためのより直接的な(そしておそらくほとんどの仮定に依存しない)方法ですが、ブートストラップには、信頼区間を生成するという追加の利点があります。 。
これは単なるアイデアの概要です。分散の割合は次のように定義されます
どこ 共分散行列の固有値です。ここで、代わりに相関行列の固有値を使用すると、、行列の固有値の合計は行列のトレースに等しいため、相関行列の場合、トレースは1の合計です。
したがって、相関行列を使用する場合、サンプル相関行列の2つの最大固有値の差に関する仮説を検定する必要があります。文献で相関行列の最大固有値の漸近分布を見つけることは確かに可能です。したがって、問題は、ある種の対応のある、または対応のないt検定に減少します。