効果的なヒートマップを構築していますか?


65

ArcGIS、QGIS、Grass、および/またはGVSIGを使用:

  • 効果的なヒートマップの構築に関与するツールとプロセスにはどのようなものがありますか?
  • 関連するプラグインは何ですか?
  • 主要なデータ要件は何ですか?
  • 既存のヒートマップの欠点は何ですか?
  • ヒートマップが効果的にカバーできない問題にはどのようなものがありますか?
  • ヒートマップを作成しない方法
  • データ表現のヒートマップよりも優れた代替案(同じコンテキスト)がありますか?

指定したツールはいずれも使用しませんが、このjjguy.com/heatmap
radek

1
ダッソーキ、「ヒートマップ」とはどういう意味ですか? ウィキペディアは、それが一連​​の値のコロプレス表現であると考えているようです。これは微妙ですが、重要なことですが、このスレッド内のすべての応答とは異なります。これは、グリッド(または画像)ベースの属性、特にポイントデータからグリッドに補間された属性のマップを意味するものです。箇条書きの各質問に対する答えは、真のヒートマップでは異なります。
whuber

回答:


74

この質問はコミュニティWikiおよびwikiロックに変換されました。これは、回答のリストを求める質問の一例であり、閉鎖から保護するのに十分人気があるように見えるためです。これは特別なケースとして扱われるべきであり、これや他のStack Exchangeサイトで推奨されている質問の種類と見なすべきではありませんが、より多くのコンテンツを投稿したい場合は、この回答を編集して自由に投稿してください。


少なくとも2種類のヒートマップがあります。

  1. ポイントの集中を表すヒートマップ、および
  2. 属性値の分布を表すヒートマップ

すべての方法には長所と問題がありますが、詳細についてはこのQ&Aをはるかに超えていると思います。

QGISとGRASSのいくつかのメソッドと関数をリストしてみます。

ポイントの集中

野生動物や乗り物などの動きを追跡している場合、ロケーションメッセージが集中している地域を評価するのに役立ちます。

ツール:QGIS Heatmapプラグイン(バージョン> 1.7.xで利用可能)またはGRASS v.neighborsまたはv.kernel

属性値の分布

ここでは、基本的に補間方法について多かれ少なかれ話しています。メソッドが含まれます:

  1. IDW

    実装に応じて、グローバル(セット内の使用可能なすべてのポイントを使用)またはローカル(ポイントの数またはポイントと補間された位置間の最大距離によって制限される)になります。

    ツール:QGIS補間プラグイン(グローバル)、GRASS v.surf.idwまたはr.surf.idw(ローカル)

  2. スプライン

    繰り返しますが、可能な実装の膨大な数。B-スプラインが人気です。

    ツール:GRASS v.surf.bspline

  3. クリギング

    さまざまなサブタイプの統計的方法。

    ツール:GRASS v.krigeヒントはom_hennersに感謝)またはRを使用


1
GRASSを介したkrigingのインターフェースv.krige(grass.osgeo.org/wiki/V.krige_GSoC_2009)がありますが、RおよびGRASS Wikiページで言及されているさまざまなRパッケージとバインディングが必要です。
om_henners

QGIS 2.8以降、ポイントレイヤー用のヒートマップレンダラーがあります。新しいデータを作成する必要はありません。
アレクサンドル・ネト

34

統計的には、ヒートマップの実行方法を次に示します。

1)ポイントフィーチャを統合します。統合の考え方は、一致すると見なされるポイントを取得し、それらを単一の場所としてマージすることです。最近傍分析を使用し、そこから適切な値を使用するのが好きです。(たとえば、犯罪ヒートマップを実行するとき、犯罪がジオコーディングされる基礎となる区画データセットに、平均1番目の最近傍を使用します)。

2)イベントを収集します。これにより、統合されたすべてのポイントの空間ウェイトが作成されます。たとえば、1つの場所に5つのイベントがある場合、ウェイト5の1つのポイントになります。これは、次の2つのステップに不可欠です。プールされたイベントの属性を集約する必要がある場合、つまり、異なるイベントの重みが大きい場合は、1対1の空間結合を使用できます。「イベントの収集」出力をターゲットとして使用し、元の統合イベントを結合機能として使用します。統合されたイベントの属性を統計的に結合したフィールドマップマージルールを設定します(通常はSUMを使用しますが、他の統計を使用できます)。

3)Global Moran's Iを使用して、ピークの自己相関を決定します。それが言うように、グローバルなモランのIを異なる間隔で実行して、実行している分析に適したスケールで空間的自己相関のピークバンドを決定します。収集したイベントで最近傍を再度実行して、モランのIテストの開始範囲を決定することができます。(たとえば、最初の最近傍に最大値を使用)

4)Getis-Ord Gi *を実行します。モランのI分析に基づいて固定距離バンドを使用するか、固定距離バンドを無関心のゾーンとして使用します。収集イベントからの空間的重みは、数値カウントフィールドです。これにより、セット内の各イベントポイントのZスコアが得られます。

5)Getis-Ord Gi *の結果に対してIDWを実行します。

この結果は、カーネル密度で得られる結果とは大きく異なります。カーネル密度のようにクラスタリングに関係なく、値が高いだけでなく、高い値と低い値が一緒にクラスター化されている場所を示します。


20

私はヒートマップが好きですが、よく誤用されていることに気付きます。

通常、私が見たのは、各ピクセルの色がポイントのコレクションに適用された逆距離加重関数の結果に基づいているプロセスです。マップに重複するポイントマーカーが多数ある場合は、ヒートマップを検討する価値があると思います。

これはWebベースのapiです。

GeoChalkboardには良いチュートリアルがあります。

ArcGISでIDWを使用できます。


7
IDWはデータ収集場所に非常に敏感であることに注意してください。たとえば、データがクラスター化されている場合、数学的な異常が発生する可能性があります。
リードコプシー

@Reed Copseyどんな代替案を提案しますか?
fmark

2
@fmark:IDWの代わりに使用できる多くの補間ルーチンがあります。たとえば、ネイバー/三角測量ベースのアプローチ、クリギング、スプライン/最小張力などです。
Reed Copsey

@Reedヒートマップの数学的正確性について心配したことは一度もありません(おそらくそうすべきです)。しかし、私は彼らが多くの状況でクラスターを有効に伝えると思います。ここで私はそれが有効ヒートマップとしてレンダリングすることができると思いマップの例です:www2.clustrmaps.com/counter/maps.php?url=http://clustrmaps.com
カークKuykendall

2
彼らは素晴らしいツールだと思います。数学的/統計的な正確性は、おそらく意思決定に結果を使用している場合にのみ重要ですが、分布の一般的な意味を伝えるのであれば、IDWはおそらく大丈夫です。(これは、より多くのが原因数学的な異常に、特にクラスタ間、ヒートマップの結果に大きな「スキュー」を引き起こしたクラスタの問題だ。)
リードCopsey

12

単純なヒートマップとcountour lineの生成のために、Grass統合でQGisを使用しました。

  1. データポイントをロードする
  2. 制限的な形状を読み込む–郡の境界など
  3. Grassマップセットを作成する
  4. Grassツールボックスを開き、モジュールリストをクリックして各ツールを検索します
  5. ロードv.in.ogr.qgisたびにクリックして覚えて、モジュールをポイントデータとの境界形状の両方をロードビュー出力を同様に各有益な名前を与える-各用pointdatamaskshape
  6. maskshapeをラスターに変換してv.to.rastでマスクとして使用し、mapsetに追加します(maskrasterのような名前を付けます) -複雑なポリゴンでは時間がかかります。
  7. r.maskモジュールをロードして、次のアクションを強制的にバッファー領域に制限します。
  8. v.surf.rstを実行して、ポイントデータから補間グリッドを作成します。補間を行うための属性フィールドとして適切な列を選択し、rastersurfaceのような名前を付けます。これは、時間がかかり、ヒートマップの目的として使用できる、または3Dシェーディングが可能なラスタを生成するビットです。
  9. Grassツールボックスを閉じます
  10. 入力としてGRASSラスターを選択するGDALラスターコンタープラグインを使用します。デフォルトのレベル値を10のままにして、輪郭形状ファイルが保存される出力ディレクトリを選択します。「属性名」を確認し、名前を入力します。

NB:これが機能するためには、データセットが同じ投影にある必要があります!


4

この問題は、問題に関するいくつかの点を除いて、大部分が回答されたと思います。

ヒートマップは素晴らしいものですが、古典的な欠陥と問題は解釈にあります。犯罪発生率のヒートマップと犯罪率/割合のマップ(ヒートなど)の違いを比較してください。イベントヒートマップは、全体的なイベント密度を特定するという点では有用かもしれませんが、リスクの推定値として盲目的ですが、多くの場合、この方法で解釈または誤用されます。同じサイズと形の地域で同じ数のイベントを考えてみましょう。ただし、人口は異なりますが、犯罪はそのエリアに集中している可能性があります。また、ヒートマップラスターを生成するには人口のモデルのようなイベントが必要になる可能性がありますが、人々は立ち止まる傾向がないため、犯罪などのイベントデータのレートをモデル化することは困難です。

2番目の問題は、ヒートマップが単一の空間スケールの検討に限定されており、この空間スケール、つまりカーネルサイズまたは減衰率を選択することは複雑で、研究の目標に依存するが、正当化する必要があることです。ポイントが最強のクラスターの中心とそれが発生する規模を特定することである場合(おそらく、疾病の発生源とその広がりの要因を特定するため)、より良い選択肢は複数の規模を考慮することです。スケール/面積に比例する適切な重み付けにより、3次元ラスターを生成します。3D空間スケールラスターの極大値は、クラスターの中心の位置とそれぞれのサイズ、およびスケール間の持続性を示します。


1
あなたはいくつかの非常に有効なポイントを作ります。これらの2つの問題は、実際には地理の古典的な問題です。最初の問題は、空間の根底にある不均一性の解釈に関連しています。つまり、人々の分布は不均一であるため(一部の地域がまばらに存在するため)、犯罪の機会も不均一です。一方のパターンは、もう一方のパターンによって強制されます。スケールの2番目の問題は、修正可能な面積単位問題(MAUP)の一部です。この問題は、密度などの測定領域に依存する測定値に影響します。これは、ほとんどの地理的作業における古典的な問題です。
WhiteboxDev

空間パターンの最初のカットとして、ティーセンポリゴンも検討してください。それらは非常にシンプルですが、多くの詳細を表示することができ、正確な補間器であり、他のより洗練された補間方法を悩ますスケールの問題のいくつかを回避するようです-gislandscapeecology.blogspot.com/2016/04/…
トムディルツ16年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.