タグ付けされた質問 「clustering」

クラスラベルなどの既存の知識を使用せずに、データポイントを相互の「類似性」に従ってオブジェクトのサブセットに分割します。

7
PostGISを使用した空間クラスタリング?
私は、ポイントフィーチャ用にPostGIS対応データベース内で使用する空間クラスタリングアルゴリズムを探しています。入力として同じクラスター内のポイント間の距離を取得するplpgsql関数を作成します。出力では、クラスターの配列を返します。最も明らかな解決策は、フィーチャの周囲に指定された距離のバッファゾーンを構築し、このバッファ内でフィーチャを検索することです。そのような機能が存在する場合、それらの周囲にバッファの構築などを続けます。そのような機能が存在しない場合、クラスタ構築が完了したことを意味します。たぶん巧妙な解決策がありますか?

5
QGISを使用してベクトルポイントデータ内のクラスターを識別しますか?
田舎のブロードバンドデータポイントのベクトルデータセット(どのくらい高速かなど)があり、同様の特性を持つポイントのクラスターがあるかどうかを調べ、それらを囲むポリゴンをプロットしたいと思います。 たとえば、1つのPostGISデータセットに45,000ポイントがあり、ランドスケープに分散している場合があります。互いにx km以内にあり、速度がy kbps未満であるクラスターを識別し、適格なクラスターごとに凸包を生成します。 たとえば、QGISでこれを行う簡単な方法はありますか?

7
Rで空間データをクラスタリングしますか?[閉まっている]
緯度と経度のデータポイントがたくさんあります。Rを使用して、距離に基づいてクラスター化します。 私はすでにこのページを見て、clustToolパッケージを試しました。しかし、clustToolのclust関数がデータポイント(lat、lon)を空間データと見なし、適切な式を使用してそれらの間の距離を計算するかどうかはわかりません。 つまり、空間データと順序データをどのように区別するかわかりません。マップ上の2つのポイント(空間)と2つの通常の数値の間の距離の計算は異なると思います。(そうではありませんか?) また、クラスタリングで3番目のパラメーターを検討する場合はどうなりますか? (lat、lon)ともう1つのパラメーターがある場合に言うように。 距離はどのように計算されますか? clustToolのもう1つの問題は、GUIを念頭に置いて設計されていることです。ライブラリのGUIオーバーヘッドを必要としないのでスキップする方法はわかりません。 空間データのクラスター分析のために、Rにはどのようなオプションがありますか?

9
GPSトラックからポリラインベースの「ヒートマップ」を作成しますか?
この冬、GPSを使用してダウンヒルスキー/スノーボードを追跡する予定です。私のライディングのほとんどは同じリゾートで行われます。特定の領域で実行した実行の量を示す一種の「ヒートマップ」を作成できるようにしたいと思います。データベースにGPSトレースをますます追加するので、私の目標は、最も移動したエリアの一種の線形ヒートマップを表示することです。ダウンヒルスキーの性質を考えると、上り坂のチェアリフトラインは何度も何度も訪れる唯一の場所であるため、「最も暑い」場所になることが予想されます。 1)私のトラックは毎回同じではないこと、2)1回の「走行」でカバーされるエリアは数百フィートの幅があることを考えると、この「線形」データを分析してソートを作成する最良の方法は何でしょうかヒートマップの?私の考えは、ラインをバッファリングし、次にポリを交差させて、一種のベン図を作成することでした。私の好みは、オープンソース技術を使用することです。QGISとPostGISをロードして使用可能にしました。 更新:@ blah238の応答に関して、あるエリアを通るパス(「ラン」)の数を「収集」し、カウントでシンボル化できるものを考えていました。概念的には、これはArcGISの「イベントの収集」(ただし、ポイントではなくラインの場合)または二重線を中心線に折りたたむ(ただし、ほぼ同じ領域の複数のラインの場合)ことに似ています。 同様の概念のより視覚的な例としては、交通量の多い地図が挙げられます。交通量の多いエリアは、「非常に移動しやすい」スキーラン/エリアに相当します。 私はいくつかのアイデアを与えるかもしれない次の質問を読みましたが、彼らは私が達成しようとしていることを実際に扱っていません: 軌跡のクラスタリング((x、y)ポイントのGPSデータ)およびデータのマイニング GPSルートのエラー管理(理論的枠組み?)

1
地域化/再区画化のツールを探していますか?
この投稿はコミュニティWikiです。この投稿を改善するには、既存の回答を編集してください。現在、新しい回答は受け付けていません。 GISの地域化/地区化のためのツールを探しています。 これまでのところ、私は識別することができました Districting ArcGISエクステンション(現在もオンライン) REDCAP(現在5万の入力ポリゴンに制限されています) iRedistrict(まだリリースされていない) R法 他に何かありますか?特に、非常に大きなデータセット(〜130万ポリゴン)を処理するのに問題のないものは何ですか?

1
QGISを使用して複数のラスターレイヤーをクラスタリングしてサブリージョンを作成しますか?
重複するラスターレイヤー(深さ、電流、波などの物理レイヤー)の束のクラスター分析に基づいて、ポリゴンからn個のサブ領域を作成しようとしています。 現在、ポリゴン全体に通常のグリッドを作成し、物理ラスターレイヤーから物理属性を抽出し(例:Gridspotまたは同等のツール)、n個のクラスターに制限されたクラスター分析を実行できます(Rまたはその他の統計パッケージ内)。 次に、各クラスターグループを特定し、それらをGIS(QGISまたはArcMap)にプロットします。ただし、一部のクラスターグループは分散され(空間的外れ値であり、意味のない)、一部はクラスター化される(サブリージョンとしての価値がある)ことを想定しています。 次に、代表的なクランプを手動で描画して、n個のサブ領域を作成できます。 QGISで実行できるArcMap 10.1 Grouping Analysisのようなツールはありますか?10.0のみを実行しています。 n個のサブ領域(バイオ領域)を作成するために、複数のラスターレイヤーのクラスター分析を行うより良い方法の提案はありますか?

4
最小nポイントを含む不規則なグリッドを生成するにはどうすればよいですか?
不均一に分布したポイントの大きなサンプル(最大100万個)を指定すると、指定された最小数のnポイントを含む不規則なグリッド(サイズは可能ですが、形状が不規則になる可能性もあります)を生成できますか? そのようなグリッドのジェネレートされた「セル」に正確にn個のポイントまたは少なくともn個のポイントが含まれている場合、私にとってはそれほど重要ではありません。 ArcGISのgenvecgridやQGIS / mmgisのグリッドレイヤーの作成などのソリューションを知っていますが、それらはすべて通常のグリッドを作成し、空のセル(小さな問題-単純に破棄できます)またはポイントカウントのセルを出力します。n未満(おそらくここからいくつかのツールを使用して、これらのセルを集約するソリューションが必要になるため、より大きな問題ですか?)。 私は何の役にも立ちませんでしたが、商用(ArcGISと拡張機能)または無料(Python、PostGIS、R)の両方のソリューションにオープンです。
20 r  clustering  quadtree 

1
QGIS 3.0ポイントクラスターレンダラー、レンダリングの順序(zオーダー)を制御することは可能ですか?
私はQGIS 3.0.2の新しいポイントクラスターレンダラーで遊んでいますが、それは素晴らしいです-自分でクラスタリングを行うよりもずっと簡単(かつ高速)です。 私の言いたいことを示すために、STATS19データと半径30mを使用したエジンバラの交通事故の例を示します。 最大のクラスターが小さなクラスターの前に描画されるようにzオーダーを設定する方法を見つけることはできません。 私は@cluster_size変数を知っています。これは、シンボルのスケーリングと色付けに使用しているものです。このために、サイズと色のアシスタントを使用しています。フォントマーカーを削除して、各クラスターからテキストを削除しました。 マーカーのサイズは次のように定義されます: coalesce(scale_exp(@cluster_size, 0, 50, 1, 200, 0.57), 0) マーカーの色は次のように定義されます: coalesce(ramp_color('custom ramp',scale_linear( @cluster_size, 0, 50, 0, 1), '#000000') 私が今までに試したこと:- シンボルレベル -運はありません。変数名を選択できません。 レイヤーのレンダリング>フィーチャーのレンダリング順序を制御し、@ cluster_sizeをソートとして選択します。効果がないようです。 式として@cluster_sizeを使用した段階的なスタイルは機能しません。 これが可能かどうか誰もが知っていますか、またはこれはこの特定のレンダラーの制限ですか? これを行う方法は他にもたくさんあります(バッファ/空間結合、プラグイン)が、新しいレンダラーはもっと速くなるはずです。または、私は明白な何かを見落としましたか?:)

6
OpenLayers / Leafletでアニメーションクラスターマーカーを作成する方法
Openlayersが一致しないように見える滑らかな遷移のために、私はLeafletを使用したいと思います。カスタムスタイルのマーカーグループでマーカーをクラスター化する機能が特に必要です。 私が達成しようとしていることを示す最良の例は、Redfinにあります。 クラスターにカーソルを合わせると滑らかなアニメーションが提供され、マーカーをクリックすると、アニメーション効果でクラスターが分割されます。個々のポイントが特定の許容範囲と重ならないズームレベルに達すると、実際のマーカーはアニメーション化された位置に分割されます。 似たような効果をこれらに統合したいので、最善のアプローチに関するいくつかのガイダンスや、あなたが知っているかもしれない他の例に感謝します。 注: Redfinは、使用したくないFlashを使用しているようです。理想的な状況では、可能であればJavascriptでこれを実現したいと思いますが、おそらくHTML5 / canvasで行う必要があると思います。 たぶんpの使用。-Raphael.jsまたはd3.js 何か案は? ところで- この例は見つかりましたが、Googleマップに特に当てはまるようです。

3
無向線のクラスタリング
私は、方向に関係なく線をクラスター化する効率的な方法を探しています。つまり、ニューヨークとロサンゼルスを結ぶ線は、ロサンゼルスとニューヨークを結ぶ他の方向の線と同じクラスター内にある必要があります。開始点/終了点の位置は類似している必要があります(つまり、サンディエゴからロングアイランドまではLA-NYと同じクラスター内にあるはずですが、サンフランシスコからボストンまではおそらくそうではありません)。中間点はありません。入力データは次の例のようになります。 (日本語版ウィキペディアGFDLまたはCC-BY-SA-3.0の Cassiopeia sweetによる、Wikimedia Commons経由) 以前に行を事前に並べ替えてみました。たとえば、すべてを西から東に走らせるようにしましたが、これは北から南に走る線やその他の方向の線の問題を解決しません。 この問題に対処するアルゴリズムを知っていますか?私は探していましたが、無向セグメントの平均方向を計算するアルゴリズムに加えて、リモートで役立つものは見つかりませんでしたので、間違った検索用語を使用する必要があります。

3
Webマップでクラスター化された機能を視覚化しますか?
ArcGIS Server JS APIでクラスター化された機能を表示するのに最適なシンボルを探しています。 Silverlight APIクラスタリングまたはJSクラスタリングサンプルで使用される「フライアウト」アニメーションクラスターシンボルは好きではありません(少しギミックが感じられます)。 これまでのところ、私が見つけた最良のオプションはGoogle Maps マーカーclustererシンボルです。 クラスターシンボルの中央には数字を表示しませんが、このモックアップのように、特徴の集中を示すためにシンボルのサイズを変更します。 他にどのようなクラスタリングシンボルオプションがありますか?マーカークラスタリングの優れた実装を示すマップを教えていただけますか?

1
ポイントの場所と関連するポイント値に基づいた地理データのクラスタリング
経度、緯度、およびこのポイントの3番目のプロパティ値を持つデータポイントを指定します。プロパティ値に基づいてポイントをグループ(地理的サブリージョン)にクラスター化するにはどうすればよいですか?私はグーグルで検索し、この問題は「空間的制約付きクラスタリング」または「地域化」と呼ばれているようだと考えました。しかし、私は地理データの処理に精通しておらず、どの種類のアルゴリズムが適しているか、このタスクにどのpython / Rパッケージが適しているかについてはわかりません。 私が欲しいものについてより直感的なアイデアを与えるために、私のデータ散布図は次のようだとしましょう: したがって、各ドットは点、xは経度、yは緯度、カラーマップは値が大きいか小さいかを示します。値の位置と類似性に基づいて、これらのポイントをサブリージョン/グループ/クラスターに分割したいと思います。次のように(直感的なアイデアを示すためだけではありません)。 どうすればこれを達成できますか?

3
フォレストギャップ内のツリーがRを使用してクラスター化されているかどうかを判断しますか?
添付のデータセットは、約50の可変サイズの森林ギャップに約6000の苗木を示しています。これらの苗木がそれぞれのギャップ内でどのように成長しているのか(クラスター化、ランダム、分散)を知りたいと思います。ご存知のように、従来のアプローチはGlobal Moran's Iを実行することです。ただし、ギャップの集合内のツリーの集合は、Moran's Iの不適切な使用のようです。これは無意味な結果をもたらしました(つまり、p値= 0.0000000 ...)。ギャップ集約間の相互作用により、これらの結果が生成される可能性があります。個々のキャノピーのギャップをループし、各ギャップ内のクラスタリングを決定するスクリプトを作成することを検討しましたが、これらの結果を一般に表示することには問題があります。 クラスター内のクラスタリングを定量化するための最良のアプローチは何ですか?

5
軌跡のクラスタリング((x、y)ポイントのGPSデータ)およびデータのマイニング
GPSデータセットの分析に関して2つの質問があります。 1)軌跡の抽出フォームの記録されたGPS座標の巨大なデータベースがあります(latitude, longitude, date-time)。連続するレコードの日時の値によると、私はその人がたどるすべての軌跡/パスを抽出しようとしています。例えば; 時間から言うとM、(x,y)ペアは時間まで連続的に変化していNます。後N、(x,y)ペアの変化は減少し、その時点で、時間MからN軌道と呼ぶことができます。それは軌道を抽出するときに従うべき適切なアプローチですか?提案できるよく知られたアプローチ/方法/アルゴリズムはありますか?これらのポイントを効率的な方法で維持することを提案したいデータ構造または形式はありますか?おそらく、各軌跡について、速度と加速度を把握することが有用でしょうか? 2)軌跡のマイニングすべての軌跡をたどる/パスを取得したら、それらを比較/クラスタリングするにはどうすればよいですか?開始点または終了点が類似しているかどうかを知りたいのですが、中間パスはどのように比較されますか? 2つのパス/ルートを比較して、それらが類似しているかどうかを判断するにはどうすればよいですか。さらに; 同様のパスを一緒にクラスター化するにはどうすればよいですか? この件に関する研究などを指摘していただければ幸いです。 開発はPythonで行われますが、あらゆる種類のライブラリの提案を歓迎します。 StackOverflowでまったく同じ質問/programming/4910510/comparing-clustering-trajectories-gps-data-of-xy-points-and-mining-the-dataを開いています。ここでもっと答えが得られると思いました...

4
ArcGIS Desktopを使用してX距離内のNポイントのクラスターを検索しますか?
クラスター分析の2つの方法を試しました。 クラスターと外れ値 ホットスポット ...しかし、これらの3つのパラメーターを持つ仕様を満たしていません。 ポイントフィーチャセット クラスター内のNポイント 調べるX距離バンド たとえば、「各クラスターが50メートル以内に10個のポイントを持っているポイントを見つけてください」などです。 ArcGIS 10には上記でリンクした2つのツールがありますが、どちらもクラスターパーツ内のNポイントに対応していないようです。 ArcGISの他のツールで要件を満たすことができますか?私がクラスター分析と呼んでいるものは、特定のクラスタリングタイプとして知られていますか? 別のアプリケーションでこのバージョンを使用しましたが、ArcGIS内でツールを使用したかったのです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.