MantelのテストがMoranのIよりも優先されるのはなぜですか?


37

Mantelのテスト、動物の空間的分布(空間内の位置)と、たとえば遺伝的関連性、攻撃率、またはその他の属性との相関関係を調べるために、生物学的研究で広く使用されています。多くの優れたジャーナルがそれを使用しています( PNAS、動物行動、分子生態学...)。

自然界で発生する可能性のあるパターンをいくつか作成しましたが、マンテルのテストはそれらを検出するのにまったく役に立たないようです。一方、モランの私はより良い結果得ました(各プロットの下のp値を参照)

なぜ科学者はモランのIを代わりに使用しないのですか?見えない隠れた理由はありますか?そして、何らかの理由がある場合、マンテル検定またはモラン検定を適切に使用するためにどのように知ることができますか(仮説をどのように構成する必要があるか)?実際の例が役立ちます。

この状況を想像してください。カラスが各木に座っている果樹園(17 x 17本)があります。各カラスの「ノイズ」のレベルが利用可能であり、カラスの空間分布が彼らが作るノイズによって決定されるかどうかを知りたいです。

(少なくとも)5つの可能性があります。

  1. 「羽の鳥が集まってきます。」カラスが似ているほど、それらの間の地理的距離は小さくなります(単一クラスター)

  2. 「羽の鳥が集まってきます。」繰り返しますが、似ているカラスは、それらの間の地理的距離が小さくなります(複数のクラスター)が、ノイズの多いカラスの1つのクラスターは、2番目のクラスターの存在に関する知識を持ちません(そうでなければ、1つの大きなクラスターに融合します)

  3. 「単調トレンド。」

  4. 「反対は引き付ける。」同様のカラスは互いに立つことができません。

  5. 「ランダムパターン。」ノイズのレベルは、空間分布に大きな影響を与えません。

それぞれの場合について、ポイントのプロットを作成し、マンテル検定を使用して相関を計算しました(その結果が重要でないことは驚くことではありません。そのようなポイントのパターン間の線形関連を見つけることは決してありません)。

ここに画像の説明を入力してください


サンプルデータ:( 可能な限り圧縮)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

地理的距離のマトリックスの作成(モランのIは逆になります):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

プロット作成:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

UCLAの統計ヘルプWebサイトの例のPSは、両方のテストがまったく同じデータとまったく同じ仮説で使用されていますが、これはあまり役に立ちませんMantel testMoran's Iを参照)。

IMへの対応 あなたは、ライトを持っています。

... [マンテル]は、静かなカラスが他の静かなカラスの近くにあるかどうかをテストしますが、騒々しいカラスには騒々しい隣人がいます。

そのような仮説は、マンテル検定では検証できないと思います。両方のプロットで、仮説は有効です。しかし、ノイズのないカラスの1つのクラスターが、ノイズのないカラスの2番目のクラスターの存在に関する知識を持っていない場合、マンテルステストは再び役に立ちません。そのような分離は、本質的に非常に可能性が高いはずです(主に大規模なデータ収集を行う場合)。

ここに画像の説明を入力してください

回答:


19

MantelテストとMoranの2つの非常に異なる概念を参照しています。

Moran's Iを使用する理由は、空間的自己相関の問題です。つまり、空間と変数との相関関係です。面積単位でのイベントの発生が、隣接する面積単位でのイベントの発生の可能性をどの程度まで可能にするかを知りたい場合は、MoranのIを使用します。言い換えると(例を使用して):木にうるさいカラスがいる場合、近所に他のうるさいカラスがいる可能性はどれくらいか、またはありそうにないでしょうか?Moran's Iの帰無仮説は、対象変数の空間的自己相関ではありません。

マンテル検定を使用する理由は、変数間の類似性または非類似性の問題です。予測変数(空間)の点で類似しているサンプルが、従属変数(種)の点でも類似している傾向があるかどうかを知りたい場合は、マンテル検定を使用します。簡単に言うと、互いに近いサンプルも組成的に似ており、互いに空間的に離れているサンプルも組成的に異なっていますか?あなたの例を使用すると、静かなカラスが他の静かなカラスの近くにあるかどうかをテストしますが、騒々しいカラスには騒々しい隣人がいます。帰無仮説は、空間位置とDVの関係ではありません。
これに加えて、部分的なマンテルテストでは、3番目の変数を制御しながら2つの変数を比較できます。
たとえば、比較するときはマンテル検定が必要です

  • 同じサンプルユニットのセットを形成する生物の2つのグループ。
  • 妨害の前後のコミュニティ構造;
  • 遺伝的/生態学的距離および地理的距離。

ここマンテル検定とその応用には良い議論があります。

(Ladislav Nadoの新しい例に応じて編集)

私が推測するかもしれない場合、あなたの混乱の理由は、2つの連続変数、または1つの距離行列(空間内の位置)と1つの連続変数(ノイズ)のいずれかとして、あなたの例で空間とノイズを考え続けることです。実際、このような2つの変数間の類似性を分析するには、両方距離行列と考える必要があります。あれは:

  • 1つのマトリックス(たとえば、スペース用)は、地理座標の各ペアの違いを示します。隣り合って座っている2羽のカラスの値は、離れて座っているカラスの値よりも低くなっています。
  • 別のマトリックス(環境、遺伝、またはその他の構造)は、特定のポイントで測定された結果の違いを示します。同じレベルのノイズを持つ2つのカラスの値(それらが静かであるかノイズがあるかは関係ありません-それは単なる類似性の尺度です!)は、異なるレベルのノイズを持つカラスのペアの値よりも低くなっています。

次に、マンテル検定は、これら2つの行列の対応する値の外積を計算します。マンテル統計は、2つの距離行列間の相関であり、これらの行列を形成するために使用される変数間の相関と等価ではないことを再度強調しておきます。

次に、写真AとBで示した2つの構造を考えてみましょう。
写真Aでは、カラスの各ペアの距離は、ノイズレベルの類似性に対応しています。ノイズのレベルに小さな差があるカラス(各静かなカラス対別の静かなカラス、各ノイズの多いカラス対別のノイズの多いカラス)は近くにとどまり、一方、ノイズのレベルに大きな違いがあるカラスの各ペア(静かなカラス)対ノイズの多いカラス)お互いに近づかない。マンテル検定は、2つのマトリックス間に空間相関があることを正しく示しています。
ただし、写真Bでは、カラス間の距離ノイズレベルの類似性に対応しています。騒がしいカラスはすべて一緒にいますが、静かなカラスは近くにいてもいなくてもかまいません。実際、いくつかの異なるカラスのペア(1つの静かな+ノイズの多い)の距離は、いくつかの類似したカラスのペア(両方が静かな場合)の距離よりも小さくなります。
写真Bには、研究者がランダムに2つの似たカラスを拾った場合、それらが隣人になるという証拠はありません。研究者がランダムに2つの隣接する(またはそれほど遠くない)カラスを拾った場合、それらが似ているという証拠はありません。したがって、最初の主張On both plots the hypothesis validは正しくありません。図Bのような構造は、2つのマトリックス間に空間的な相関関係がないことを示しているため、マンテル検定に失敗します。

もちろん、さまざまなタイプの構造(類似したオブジェクトの1つまたは複数のクラスターを含む、または明確なクラスター境界をまったく持たない)が実際に存在します。また、Mantelテストは完全に適用可能であり、テスト対象のテストに非常に役立ちます。別の良い読書をお勧めする場合は、この記事では実際のデータを使用し、MoranのI、Gearyのc、およびMantelテストについて非常にシンプルで理解しやすい用語で説明します。

すべてがもう少し明確になることを望みます。ただし、まだ何か不足していると思われる場合は、この説明を拡張できます。


1
答えてくれてありがとう、しかし、あなたが書いた仮説(現実のマンテル検定仮説の)は現実のデータでは役に立たないと思う。上記の回答を追加します。ご回答いただければ幸いです。たぶん私は間違っています。
ラディスラフナオ

@Ladislav Nado答えを更新しました。必要に応じて、さらに説明を求めることをheしないでください。
IM

感謝します。あなたが推薦した記事を「かみ砕く」と、ついに理解しました。
ラディスラフナオ

1
@LadislavNado素晴らしい!助けてくれてうれしい。
IM
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.