Rでの空間データのクラスタリング


12

一連の海面水温(SST)の月次データがあり、いくつかのクラスター方法論を適用して、同様のSSTパターンを持つ領域を検出したいと考えています。1985年から2009年まで実行される毎月のデータファイルのセットがあり、最初のステップとして各月にクラスタリングを適用したいと考えています。

各ファイルには358416ポイントのグリッドデータが含まれており、約50%が陸地であり、NAである99.99値でマークされています。データ形式は次のとおりです。

   lon     lat   sst
-10.042  44.979  12.38
 -9.998  44.979  12.69
 -9.954  44.979  12.90
 -9.910  44.979  12.90
 -9.866  44.979  12.54
 -9.822  44.979  12.37
 -9.778  44.979  12.37
 -9.734  44.979  12.51
 -9.690  44.979  12.39
 -9.646  44.979  12.36

CLARAクラスタリング手法を試してみたところ、見かけ上は良い結果が得られましたが、それはただの平滑化(グループ化)アイソラインであるようにも思えます。そして、これが空間データを分析するのに最適なクラスタリング手法であるかどうかはわかりません。

このタイプのデータセット専用のクラスタリング方法はありますか?いくつかの参照は、読み始めるのに良いでしょう。

前もって感謝します。


2
cran.r-project.org/web/views/Spatial.htmlをチェックアウトする必要があります。おそらく興味のある名前にクラスターを持っているパッケージがいくつかあります。
アンディW

空間データをクラスター化するための適切なRパッケージを見つけましたか?
カプタン

@kaptan残念ながら私はしなかったし、それの1つです
パコメ

この質問のタイトルが混乱さ:、いない Rを(x,y,T)R3R
GeoMatt22

回答:


2

スケーラブルなクラスタリング、分割統治アプローチ、並列クラスタリング、インクリメンタルアプローチには異なるアプローチがあります。これは、通常のクラスタリング手法を使用した後の一般的なアプローチです。私が本当に感謝しているクラスタリングの良い方法は、最も使用されているクラスタリングアルゴリズムの1つであるDBSCAN(ノイズを伴うアプリケーションの密度ベースの空間クラスタリング)です。


OK、DBSCANを探して試してみます。ありがとう
パコメ

答えがあなたを助けた場合、または別の方法を見つけた場合は、私たちに与える方が良いので、すべてのコミュニティがそれを利用します。または、回答を選択して質問を閉じます。thx。
404Dreamer_ML

回答が遅れて申し訳ありませんが、重要なことは、dbscanを試す時間がないため、最初の試行でメモリの問題が発生したことです。Rは、ベクトルを割り当てることができないと言います。779191ポイントの4 km間隔のグリッドから開始し、土地(無効な)SSTポイントを削除するときに300000ポイントで終了します。たぶん、私は正しいアプローチを得ていません、どんなヒントもありがたいです。
パコメ

1
こんにちは、まだ解決策が見つかりません。DBSCANに関するいくつかのドキュメントを読んで、いくつか質問があります。Rで最小距離を見つける方法は?私のデータは3次元の経度、緯度、および温度なので、どの「距離」を使用すればよいですか?寸法はその距離に関連していますか?温度?クラスターの最小ポイント数を決定する方法はありますか?Googleで検索すると、私のようなデータセットでdbscanを使用するRの例が見つかりませんでした。そのような例のあるWebサイトを知っていますか?だから私は読んで、私のケースに適応しようとすることができます。再びありがとう
パコメ

0

いくつかのクラスタリングがある空間分析用の適切に文書化されたpythonライブラリは 適切に pySALです。

開発段階で空間クラスタリングに焦点を当てている別のpythonライブラリはclusterPy (pdfスライドプレゼンテーション)です。

GUIソフトウェアGeoGrouperは、クラスタリングアルゴリズムの選択肢が限られていますが、優れたマッピングインターフェイスを備えています。


おかげで、私はこれまでにpythonを使ったことがありません。Rソリューションを見つけようとします
パコメ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.