同じ期間に発生したイベントのデータセットがあります。各イベントにはタイプ(10未満の異なるタイプがいくつかあります)と場所があり、2Dポイントとして表されます。
イベントの種類や種類と場所の間に相関関係がないか確認したい。たとえば、タイプAのイベントは通常、タイプBのイベントが発生する場所では発生しない可能性があります。あるいは、ある地域では、タイプCのイベントがほとんどあります。
これを実行するためにどのようなツールを使用できますか?統計分析の初心者である私の最初のアイデアは、このデータセットに対して何らかの種類のPCA(主成分分析)を使用して、各タイプのイベントが独自のコンポーネントを持っているか、または一部が同じコンポーネントを共有しているか(つまり、相関していたか)を確認することでした。
私のデータセットは約500'000ポイントであるため、処理が少し難しくなります。
編集:以下の回答とコメントに記載されているように、このワークショップレポートで詳細に説明されているように、これをマークポイントプロセスとしてモデル化し、Rを使用してすべての重い作業を実行する方法です:http:/ /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html