Rを使用して緯度/経度ペアからポイントのグループを作成しますか?


11

関心のあるポイントの位置を特定するための緯度/経度のペアを含むデータベースがあります。興味のあるポイントを10個のグループにグループ化します。グループは地理的にローカルで、正確に10個のポイントを含む必要があります。各グループは最小限の領域である必要があります。

Rのさまざまな実装を見てきましたが、いずれも(私が見ることができる)明確なクラスターサイズを指定することはできません。

以前、マップポイントを固定クラスターサイズにグループ化するように依頼しましたか?しかし、良い答えを得るために私の質問で私が十分に正確であったとは思わない。


地理的にローカル -グループが大幅に重複しないようにする必要があると思います。私のアプリケーション(監視目的でグループに人を割り当てる)では、各グループが物理的な領域でできるだけ小さい場合に理想的です。
最小面積 -再び、グループ面積を最小に保とうとします。これは、各グループの領域を指定されたしきい値以下に保つことで定量化できると思います(数十の小さなグループと1つの大きなグループを避けるため)。


2
あなたが探しているものについてもう少し正確になると役立ちます。「地理的にローカル」と「最小エリア」をどのように定量化しますか?
whuber

状況によっては、「最小面積」と「正確に10ポイント」は相互に排他的ではありませんか?たとえば、1マイルの「最小エリア」と、10マイル以内に他の機能を持たない1つの機能(外れ値、場合によっては)の両方で、両方の使用をどのように期待できますか?
RyanKDalton

いくつかの例外があると予想していますが、これらは手動で処理できます。固定サイズのデータ​​セットがあり、いくつかのグループを手動でいじるのを気にしませんが、残りの部分については自動ソリューションが本当に欲しいです!:)
グレイムヒルトン


説明はまだ自動化された方法で解決するにはあまりにも「手で波打つ」です。データを公開できますか?
BradHards

回答:


1

k最近傍ツールをお探しかもしれません。このタイプのツールを使用して、データセット内のすべてのポイントの最近傍10個を特定できます。これにはいくつかの異なるオプションがあるようです(異なるアルゴリズムを使用したり、機能がわずかに異なるものもあります)ため、どちらが最適なオプションかはわかりません。しかし、ここにいくつかのリンクがあります:

http://stat.ethz.ch/R-manual/R-patched/library/class/html/knn.html http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Classification/kNN

結果をクラスタリングアルゴリズムまたはクラスターアンサンブルツールと組み合わせて、類似の近傍セットを持つポイントのクラスターを特定し、オーバーラップがほとんどまたはまったくないポイントの分類を取得する必要がある場合があります。出力を少し手作業でいじる必要があるかもしれませんが、作業の大部分を自動化できるはずです。

いくつかのリンク:http : //jmlr.csail.mit.edu/papers/volume3/strehl02a/strehl02a.pdf http://cran.r-project.org/web/packages/clue/vignettes/clue.pdf

また、これをすべて1ステップで実行し、クラスタールールで10ポイントを適用するk-meansクラスタリングツールを見つけることもできます(ポイントの合計数を10で除算し、目的のクラスター数として選択するだけです)ツール)。


また、私はRのための槍チュートリアルが役に立ったと評価していました:ahandel.myweb.uga.edu/resources.htm
Jezibelle
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.