空間コレログラムでU字型のパターンが発生する原因は何ですか?


12

私は自分の作品で、このパターンがさまざまな距離で空間コレログラムを調べるときに、相関関係のU字型パターンが現れることに気付きました。より具体的には、近距離ビンでの強い正の相関は、距離とともに減少し、特定のポイントでピットに到達し、その後上昇します。

これは、保全エコロジーブログ、マクロエコロジープレイグラウンド(3)–空間的自己相関の例です。

モランのIコレログラム

これらのより強い距離でのより強い正の自己相関は、理論的にはToblerの最初の地理法則に違反しているため、データの他のパタ​​ーンが原因であると考えられます。私は、それらが特定の距離でゼロに到達し、その後さらに遠くで0にホバリングすることを期待します(これは、通常、低次のARまたはMA項を持つ時系列プロットで発生します)。

これを行うと、Googleの画像を検索する(参照あなたは、パターンのこの同じタイプの他のいくつかの例を見つけることができ、ここで一つの他の例のため)。パターンがモーラン私のために表示されますが、ゲーリーのC(のために表示されない場合GISサイト上のユーザーは、2つの例を掲載している12)。私自身の作業と組み合わせて、これらのパターンは元のデータで観察可能ですが、モデルに空間条件を適合させ、残差を確認すると、それらのパターンは持続していないようです。

私は、時系列分析で似たようなACFプロットを表示する例に出会ったことがないので、元のデータのどのパターンがこれを引き起こすのかわかりません。このコメントのScortchiは、正弦パターン がその時系列で省略された季節パターンによって引き起こされる可能性があると推測しています。同じタイプの空間トレンドが空間コレログラムでこのパターンを引き起こす可能性はありますか?それとも、相関関係の計算方法の他のアーティファクトですか?


これが私の作品の例です。サンプルは非常に大きく、薄い灰色の線は、参照分布を生成するための元のデータの19個の順列のセットです(したがって、赤い線の分散はかなり小さいと予想されます)。したがって、プロットは最初のプロットほど劇的ではありませんが、ピットとその後の距離での上昇は、プロットにかなり容易に現れます。(また、他の例と同様に、私の落とし穴は否定的ではないことに注意してください。もしそれによって例が大きく異なる場合、私にはわかりません。)

ここに画像の説明を入力してください

これは、上記のコレログラムを生成した空間分布を確認するためのデータのカーネル密度マップです。

DCでのKDE犯罪


1
これが正しいかどうかはわからないので、回答として投稿しませんが、距離が短い場合、近くにある観測値はほとんどなく、非常によく似ている観測値だと思います。適度な距離では、より多くの観測値が「近く」になりますが、それらは類似性が低くなるため、効果は消えます。大規模な距離では、すべてが近くにあり、それほど大きくなく、遠くの効果がドライブバックアップします。(私の故郷を研究するための5つです。)I
Sycoraxは、Reinstate Monica

@ user777がどこから来ているのかはわかりますが、空間的近傍が漸近的に大きくなるにつれて、プロットが0になる傾向がある同様の引数を期待するかもしれません。つまり、近傍が大きくなるにつれて、近傍平均は総平均に近くなります。私の頭では、相関はゼロではなくゼロに近づくと思いますが、私は簡単に間違っている可能性があります。(同じ議論が時系列にも当てはまるはずですが、このような時系列のACFプロットを見たことを覚えていません。)
Andy W

DCのkdeは、少しチェス盤を思い出させます。チェス盤からの空間自己相関プロットはどのようになりますか?近い距離では高くない(同じ正方形)、少し離れると低く(異なる正方形)、その後再び高くなるのではないでしょうか。このトピックについては、それが答えかどうかはわかりません。
gung-モニカの回復

@gung、それはその場合の距離の計算方法に依存します。クイーン隣接性のあるチェッカーボードの場合、それは負の自己回帰項と同義になります。これにより、時系列の場合、ACFプロットは正と負の相関の代わりになり、波は減衰する可能性があります。 )。時系列よりも空間分析の方が複雑です。私はこのパターンをチェッカーボードとして特徴づけません。
Andy W

2
データセットに実際に十分な空間カバレッジがないため、5 kmの距離で自己共分散を推定する必要があります(領域全体が10 kmを超えていないため、通常、データセットの何倍もカバーする必要があります。相関長。)基本的に、およそ5K離れたブロブとその間にギャップがある、ほぼ三角形の形状の高犯罪の「ブロブ」が3つあるようです。したがって、その長さで正の相関が見られるのは当然のことです。
Brian Borchers、2014年

回答:


4

説明

U字型コレログラムは、現象が発生する領域の全範囲にわたって計算が実行される場合によく発生します。特に、土壌や地下水の局所汚染などの自然界のプルームのような現象、またはこの場合のように、現象が調査地域の境界に向かって減少する人口密度(地区の高密度の都市の中心部を持ち、低密度の郊外に囲まれているコロンビア)。

コレログラムは、すべてのデータの類似度をそれらの空間的分離の量に従って要約することを思い出してください。値が高いほど類似し、値が低いほど類似性は低くなります。唯一最大の空間的な分離を達成することが可能な点の対は、地図の正反対側に位置するものです。したがって、コレログラムは境界に沿った値を相互に比較しています。データ値が全体的に境界に向かって減少する傾向がある場合、コレログラムは小さな値と小さな値しか比較できません。それらは非常に類似していることがわかります。

したがって、プルームのようなまたは他の空間的に単峰性の現象の場合、データ収集する前に、領域の直径の約半分に達するまでコレログラムが減少し、その後、増加し始めることが予想できます。

二次的影響:推定変動

副次的な影響は、コレログラムを推定するために利用できるデータポイントのペアが、遠距離よりも近距離のほうが多いことです。中距離から長距離では、そのようなポイントペアの「ラグポピュレーション」は減少します。これにより、経験的コレログラムの変動性が増加します。時々、この変動性のみがコレログラムに異常なパターンを作成します。明らかに、上部( "Moran's I")の図では大きなデータセットが使用されていたため、この影響は小さくなりましたが、それでも、3500を超える距離でプロットの局所変動の振幅が大きくなると、変動性が大きくなります。最大距離。

したがって、空間統計における長年の経験則は、調査領域の直径の半分よりも大きい距離でのコレログラムの計算を回避し、予測(補間など)にそのような大きな距離を使用することを回避することです。

空間周期性が完全な答えではない理由

実際、空間統計に関する文献は、空間的に周期的なパターンが、より長い距離でコレログラムにリバウンドを引き起こす可能性があると述べています。鉱山地質学者はこれを「穴効果」と呼んでいます。それをモデル化するために、正弦波の項を組み込んだバリオグラムのクラスが存在します。ただし、これらのバリオグラムはすべて距離によっても減衰が強いため、最初の図に示した完全な相関への極端な戻りを説明できません。さらに、2次元以上では、現象が等方性(指向性コレログラムがすべて同じ)と周期的の両方になることは不可能です。したがって、データの周期性だけでは、表示される内容は考慮されません。

何ができるか

このような状況で続行する正しい方法は、現象が定常的ではないことを受け入れ、そのドリフトの周りに追加の変動がある、いくつかの根本的な決定論的形状(「ドリフト」または「トレンド」)の観点からそれを記述するモデルを採用することです。空間的(および時間的)な自己相関がある場合があります。犯罪数などのデータへの別のアプローチは、単位人口あたりの犯罪など、さまざまな関連変数を調査することです。


ありがとうございます。エッジ効果のアドホックな重み付けが必要だと思いますか?(それはモデル残差の探索的分析には過剰かもしれません。)私の論文私は実際に非線形の空間ドリフトとトレンドの用語を使用しています-単位人口あたりの犯罪はいくつかの理由で迷惑です。居住人口は、実際に関心のあるベースラインではありません。それは、ウォーキングアラウンド人口のようなものです。都心部では、特定の時間帯に多く(20〜30回)腫れる可能性があり、非住宅施設(仕事および娯楽)との関連性が高くなります。
アンディW

ユニークなモデルを識別する方法がないため、Andyには多くの選択肢があります。空間ドリフトに関して値のモデリングを停止する場所を決定し、値(または、それらの残差)のモデリングを開始する必要があります。確率的空間モデル。U字型コレログラムは、ドリフトをモデル化する何らかのメカニズムが必要であることを強く示していると理解できます。関連する母集団によって正規化することは(たとえ大まかに見積もることしかできないとしても)、1つの方法を利用できます。別の方法として、共変量として母集団(または使用など)の測定値を含めることです。
whuber

土地利用の幅広い測定基準(バー、ガソリンスタンド、病院、学校など)と空間的な用語だけを使用して接近しました。以下は、他の共変量を一定に保つ予測のマップです。ただし、まだわずかな残余自己相関があります。小さな場所への人口のダシメトリックなマッピングがどれだけ役立つかというエラーを考えると、私は懐疑的ですが、私はその分析を最終的に行うと思います。
Andy W

これは原則的なアプローチです。理論でモデルのドリフト成分の開発を導き、次に残差を評価して、空間的自己相関のモデリングの問題に値するかどうかを判断します。多くの場合、見かけの空間関係のほとんどはドリフト項によって適切に説明され、完全な地球統計学的機構を必要とすることはまれです。問題の興味深い側面の1つは、根本的なメトリック(空間距離)は、間違いなくユークリッド距離ではなく、道路網に沿った移動時間または移動距離であるべきだということです。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.