回答:
いつものように、それはあなたの目的とデータの性質に依存します。以下のために完全にマッピングされたデータ、強力なツールリプリーズL関数の近親であるリプリーズK関数。多くのソフトウェアがこれを計算できます。ArcGISは今のところそれを行うかもしれません。私はチェックしていません。 CrimeStatはそれを行います。GeoDaとRも同様です。関連付けられたマップを使用した使用例は、
シントン、DSおよびW.フーバー。米国におけるポルカとその民族遺産のマッピング。Journal of Geography Vol。106:41-47。2007
以下は、Ripley's Kの「L関数」バージョンのCrimeStatスクリーンショットです。
青い曲線は、ゼロを囲む赤と緑のバンドの間に位置しないため、非常に非ランダムな点の分布を記録します。これは、ランダム分布のL関数の青のトレースが存在する場所です。
サンプリングされたデータについては、サンプリングの性質に大きく依存します。このための優れたリソースは、数学と統計のバックグラウンドが限られている(ただし完全に欠席しているわけではありません)人がアクセスできる、サンプリングに関するSteven Thompsonの教科書です。
一般的に、ほとんどの統計的比較をグラフで示すことができ、すべてのグラフ比較は統計的対応に対応するか、または示唆するものです。したがって、統計文献から得られるアイデアは、2つのデータセットをマップする、またはグラフィカルに比較するための有用な方法を提案する可能性があります。
注:次はwhuberのコメントに従って編集されました
モンテカルロアプローチを採用することもできます。以下に簡単な例を示します。犯罪イベントAの分布が統計的にBの分布と似ているかどうかを判断したい場合、AイベントとBイベント間の統計を、ランダムに再割り当てされた「マーカー」のそのような測定の経験的分布と比較できます。
たとえば、A(白)とB(青)の分布を考えると、
ラベルAとBを結合データセットのすべてのポイントにランダムに再割り当てします。これは、単一のシミュレーションの例です。
これを何度も(たとえば999回)繰り返し、シミュレーションごとに、ランダムにラベル付けされたポイントを使用して統計(この例では平均最近傍統計)を計算します。続くコードのスニペットはRにあります(spatstatライブラリの使用が必要です)。
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
その後、結果をグラフィカルに比較できます(赤い縦線は元の統計です)。
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
または数値的に。
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
平均最近傍統計は、問題に最適な統計的尺度ではない場合があることに注意してください。K関数などの統計は、より明らかになる可能性があります(whuberの答えを参照)。
上記は、Modelbuilderを使用してArcGIS内に簡単に実装できます。ループでは、各ポイントに属性値をランダムに再割り当てしてから、空間統計を計算します。結果を表に集計できるはずです。
spatstat
パッケージ内の関数を利用するとよいでしょう。
CrimeStatをチェックしてみてください。
ウェブサイトによると:
CrimeStatは、Ned Levine&Associatesによって開発された犯罪事件の場所の分析のための空間統計プログラムであり、国立司法研究所からの助成金によって助成されました(助成金1997-IJ-CX-0040、1999-IJ-CX-0044、 2002-IJ-CX-0007、および2005-IJ-CX-K037)。このプログラムはWindowsベースであり、ほとんどのデスクトップGISプログラムと連動します。その目的は、法執行機関および刑事司法研究者が犯罪マッピングの取り組みを支援するための補足的な統計ツールを提供することです。CrimeStatは、刑事司法およびその他の研究者だけでなく、世界中の多くの警察署で使用されています。最新バージョンは3.3(CrimeStat III)です。
シンプルで高速なアプローチは、ヒートマップとこれら2つのヒートマップの差分マップを作成することです。関連:効果的なヒートマップを作成する方法は?
多くの統計ソフトウェアで二変量相関分析を実行して、2つの変数と有意水準の間の統計的相関のレベルを決定できます。次に、クロロプレトスキームを使用して1つの変数をマッピングし、目盛り付きシンボルを使用して他の変数をマッピングすることにより、統計結果をバックアップできます。オーバーレイしたら、どの領域が高/高、高/低、低/低の空間関係を表示するかを決定できます。このプレゼンテーションにはいくつかの良い例があります。
独自の地理視覚化ソフトウェアを試すこともできます。このタイプの視覚化にはCommonGISが本当に好きです。近所(あなたの例)を選択すると、すべての有用な統計とプロットがすぐに利用できます。多変数マップの分析が非常に楽になります。
これには、クアドラト分析が最適です。これは、異なるポイントデータレイヤーの空間パターンを強調して比較できるGISアプローチです。
複数のポイントデータレイヤー間の空間的関係を定量化するクアドラト分析の概要は、 http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdfにあります。