カーネル密度に基づいてポイントをクラスター化する方法は?


10

私は商業用土地利用を表す36kポイントの大規模なデータセットを持ち、それぞれに正方形の映像を含むフィールドがあります。このデータセットでカーネル密度分析を実行し、大都市圏全体の商業用平方フィートの密度を示すラスターを生成しました。このラスターを極大に対応する領域に分割する必要があります。これを「中心」と呼びます。センターの場所は既に決定しているので、次の2つのいずれかを行う必要があります。

  • 「medoidの周りの分割」などのポイントクラスタリングツールを使用して、特定した中心の周りのクラスターにポイントをグループ化します。この方法の問題は、計算量が多いことです。また、非類似度マトリックスを使用してポイントをサイズで重み付けしようとすると、さらに負荷が高くなります。

  • カーネル密度ラスター(おおよそテレインラスターに似ています)を各中心の周りの個々の「丘」に分割します。しかし、これを行うためのツールは思いつきません。

この問題はしばらくの間私を悩ませてきました。私はRでクラスタリング手法を実行できるようになることを望んでいましたが、時間がかかり、時間が不足しています。密度ラスターを強度の近傍に分割する、または大規模なデータセットをすばやくクラスター化する簡単な方法を知っている人はいますか?


1
この質問密接に関連している:stats.stackexchange.com/questions/13995/...
whuber

1
そして、結局私も投稿しました。
Patrick

パトリックIに1 ptのだろうが.....と思う
BWill

回答:


6

密接に関連する投稿に続くディスカッションは、単純で効果的な解決策を明らかにしました。「丘」を見つけ、グリッドを上下逆さまにし(値を否定することにより)、流域を見つけます。丘はシンクであり、流域境界はグリッドをそれらのシンクに分割します。


このソリューションはシンプルで迅速、そしてまさに私が探していたものです。ありがとう。
Patrick

3

最も簡単な答えは、しきい値を使用して、しきい値を下回る領域をマスクすることです。これはあなたの中心を取り巻く明確な領域を与えるはずです。次に、それらの領域を形状に変換できるはずです。

また、空間統計ツール:ラスターデータのクラスター分析は、同様の問題の有用なディスカッションとなる場合もあります。


はい、それは非常に関連性の高い議論です!私はあなたの修士論文を読んでおり、いくつかの方法を試します。
Patrick

2
ここでは、隣接する他のセンターとセンターを区別しようとしているため、しきい値を使用してもおそらく機能しません。都市の中心部では、2つの間の境界は非常に高密度になりますが、郊外の周辺では非常に低い密度になります。しかし、私は二次導関数を使うことが効果的であることを望んでいます。
Patrick、

3

最初の問題に戻るべきだと思います:メトロ地域全体で商業用平方フィートのクラスターを見つけます。

あなたのポイントは、コマーシャル平方フィートの値を持つ小包の重心だと思いますか?各区画の合計平方フィートを含む区画のポリゴンレイヤーも使用できると思いますか?これにより、コマーシャル平方フィートとコマーシャル平方フィートのケースセット(重心)と人口(パーセルポリゴン)がそれぞれ得られます。

SatScan http://www.satscan.org/を入手して、スペースのみのポアソン分布モデルを実行すると、商業用の正方形のフッテージクラスターが非常にすばやく注文できます。(人口として、建物のスペースの平方フィートではなく、土地の平方フィートを使用することもできます。それは、より良い人口であるかもしれません。)


ポイントは重心ですが、残念ながら、データセットは各郡のパーセルレイヤーから他のユーザーによってコンパイルされ、ポイントとしてのみ配布されました。しかし、SatScanは非常に便利なソフトウェアのように見えるので、他のアプリケーションについては覚えておきます。
Patrick、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.