空間統計ツール:ラスターデータのクラスター分析


9

明らかに単純な問題がありますが、使用する明確な方法論が見つかりません。

CIESINのグリッド化された人口データセットを使用して、ベクトル凸多角形で「市街地」を区切る必要があります。

このデータセットは、全世界の人口密度値をラスターファイルとして提供します。問題は、すでにご想像のとおり、密度の値が非常に変化しており、「都市」の定義がかなり相対的であることです。

私は古典的なアプローチを試してみて、密度の値が高度であるかのように勾配を計算しましたが、勾配の値も非常に異なり、空間的に複雑で複雑でした。

私は、ArcGISとGeoDaを使用して、空間クラスタリングアルゴリズムであるLISAツール(Local Association of Spatial Association)を調査しましたが、非常に具体的なツールの中でかなり迷っています。一部のメソッドはベクトル形状でのみ機能するため、再分類とベクトル化が必要です(長時間の計算)。

使用するメソッドとツールのセットを洗練するのを手伝ってくれませんか?よろしくお願いします!


2
あなたの「都市」の定義は正確に何ですか?ところで、すべての都市部が多角形で適切に記述されるとは思いません。多くは、高度に非凸面である地理的特徴(山、海岸線、および川)によって制御される形状を持っています。
whuber

定義ではなく、定数ではありません。目標は、さまざまな環境に関して、かなり密度の高い領域を見つけることだと思います。空間統計とLISAについての考えです。あなたは凸性について正しい、私は「自己交差せず、他のポリゴンと交差しない」と書いたはずです。
LaurentJégou11年

補足として、私は空間集積ツール専用のRモジュール全体を見つけました:sp​​dep。
LaurentJégou11年

回答:


4

私は私の修士課程http://ian01.geog.psu.edu/papers/mscthesis.pdfのためにこれにいくつかの作業をしました-基本的にグラデーションの変更に取り組みましたが、ディスカッションがこれに役立つかもしれません。


ありがとう、すぐに読みますが、それは有望です:-)
LaurentJégouMar

限られたテストゾーンで、論文で説明したダブルソーベル2階微分法を試してみましたが、非常に興味深いものです。明確な都市カーネルは分離されていますが、非常に異なる密度値です。おかげで:)ところで、私は畳み込みとラスター数学を計算するために無料のオープンソースソフトウェアを使用しました:Opticks。
LaurentJégou11年

人工光の測定は、都市の状況に適したプロキシになります。グーグル検索は例の研究を見つけるべきです。
b_dev

@indiehacker-私はそれを見たが、それは文化的に依存している、例えばフランスはイギリスよりもはるかに暗い。
Ian Turton

6

人口密度の観点から見ると、「都市部」は一般に、いくつかの公理的基準のみを満たす必要があります

  1. その境界には、内部の最大密度と比較して(比較的)高密度のポイントを含めないでください。

  2. 単純に接続する必要があります(「穴」はありません)。

  3. その平均人口密度は、事前に指定されたしきい値を超える必要があります。

公理(1)が最も自然です。境界点の密度が高い場合は、境界線を外側に移動して、その点を都市部に含めます。「相対的」とは、1/10や100分の1など、最大の比率を意味することをお勧めします。 公理(2)は、都市で自然に発生する公園やその他の低密度領域を除外することを避けます。 Axiom(3)は、しきい値に依存するためやや恣意的であり、小さなコンパクトな村を排除します。

実際、任意の他の要素が少なくとも1つあります。人口密度のグリッド化されたマップは、局所的な近隣の人口を暗黙的に平均化します(場合によっては1つのセルに等しく、カーネル密度推定のカーネル半径に等しい)。レッツは、この集団のしきい値(第一焦点手段または元の密度マップを介して他のカーネル平滑化しを実行することによって変更することができる)、この暗黙の近傍サイズ、およびなどの公理1における「比較的高い」感受け入れるユーザ設定可能なパラメータを制御します結果。

これらの公理は自然にかなり単純なアルゴリズムにつながります:極大を見つけ、境界が公理(1)を満たすように境界が見つかるまでその近傍を調べ、公理(2)を満たすために穴を埋め、そのような候補領域すべてをスクリーニングする必要があります(3)によると。これは次のように行われます。

  1. 必要に応じて、密度マップを平滑化します。

  2. 密度関連のマップで「塗りつぶし」アルゴリズムを実行します(以下を参照)。

  3. 結果をRegionGroupします。

  4. RegionGroupedポリゴンから穴を削除します。

  5. 塗りつぶされたポリゴンの人口密度のゾーン合計を実行します。

  6. 母集団(密度)のしきい値を下回る合計(または平均密度)を持つポリゴンを削除します。

残っているのはあなたのソリューションです。

重要なステップ(1)についてもう少し説明しましょう。塗りつぶしアルゴリズムは、「沈み込み」を識別し、標高を超える一定量までそれらを「埋め」ます。これはまさに、(a)「シンク」を「極大」の役割を果たすようにすることができ、(b)「一定量以上」を「一定の割合」の役割を果たすようにすることを条件として、Axiom(1)が私たちに要求することです。 」これを行う方法は、密度の負の対数を埋めることです密度そのものではなく。(最初に小さな定数を密度に追加します-たとえば、1平方キロメートルあたり約0.1人-対数を取る前に、ゼロを含むセルが問題を引き起こさないようにします。)負の対数密度の「レーク」は候補を識別します。都市部。まだ3つの独立したパラメーターを操作できます(ステップ0、1、および5で入力)。それらを設定するには、「市街地」とは実際に何を意味するのかについての考えと、いくつかの実験が必要です。


詳しい回答ありがとうございます。負の対数で塗りつぶしアルゴリズムをテストするための適切なソフトウェアツールを見つける(またはプログラムする)ことを試みます。
LaurentJégou11年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.