空間的自己相関の尺度であるMoran's Iは、特に堅牢な統計ではありません(空間データ属性の歪んだ分布に敏感になる可能性があります)。
空間的自己相関を測定するためのより堅牢な手法は何ですか?Rのようなスクリプト言語で容易に利用可能/実装可能なソリューションに特に興味があります。ソリューションが固有の状況/データ分布に適用される場合は、回答でそれらを指定してください。
編集:いくつかの例を使って質問を拡大しています(元の質問に対するコメント/回答に応じて)
順列手法(MoranのIサンプリング分布がモンテカルロ手順を使用して生成される)が堅牢なソリューションを提供することが示唆されています。私の理解では、このようなテストは、およそいかなる仮定にする必要がなくなりますということですモーランI分布を、私はのための方法を置換技術を補正する参照に失敗し、(検定統計量は、データセットの空間構造によって影響を受ける可能性があることを考えると)が、非正常に分散属性データ。2つの例を示します。1つは、ローカルモランのI統計に対する歪んだデータの影響を示すもの、もう1つは置換テストの下でのグローバルモランのIに対するものです。
私はZhangなどを使用します。最初の例としての(2008)の分析。彼らの論文では、置換テスト(9999シミュレーション)を使用して、ローカルモランのIに対する属性データ分布の影響を示しています。GeoDaの元のデータ(左パネル)と同じデータのログ変換(右パネル)を使用して、鉛(Pb)濃度(5%信頼レベル)の著者のホットスポット結果を再現しました。元のPb濃度と対数変換されたPb濃度の箱ひげ図も表示されます。ここでは、データを変換すると、重要なホットスポットの数がほぼ2倍になります。この例は、モンテカルロ法を使用している場合でも、ローカル統計が属性データの分布に敏感であることを示しています!
2番目の例(シミュレーションデータ)は、置換テストを使用する場合でも、歪んだデータがグローバルモランのIに与える影響を示しています。Rの例を次に示します。
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
P値の違いに注意してください。歪んだデータは、5%の有意水準でクラスタリングが存在しないことを示します(p = 0.167)が、正規分布データは存在することを示します(p = 0.013)。
Chaosheng Zhang、Lin Luo、Weilin Xu、Valerie Ledwith、地元のMoran's IとGISを使用して、アイルランドのゴールウェイの都市土壌におけるPbの汚染ホットスポットを特定します。 、212-221ページ