空間点プロセス:不均一な1次強度関数は2次依存性に影響しますか?


7

タイトルが示すように、一次強度関数の効果について少し混乱しています。特定の領域でポイントが発生する可能性が高いと言う一次強度関数がある場合、その領域で発生するポイントがはるかに多くなり、ポイントがその領域でクラスター化しているように見え、その後その領域で点パターンがクラスター化されていることを示唆しています。したがって、1次強度の不均一性は2次強度に影響を与えるようです。

私の理解では、一次強度関数は、ポイントが発生する強度の一般的なレベルを指定します。次に、その強度に基づいて、特定の領域のポイントが同じ強度のポアソンプロセスと比較してクラスター化されているか反発的であるかが、2次の強度関数によって決定されます。

私の理解が正しければ、一次強度をできるだけ詳細に記述すれば、どの点パターンも不均一なポアソンプロセスと見なすことができます。しかし、もちろん、それは過剰適合の場合になります。

この理解は正しいですか?

回答:


4

1次強度と2次強度は、ほぼ独立して変化するプロセスのさまざまな側面を測定します。 特に、すべてのポイントプロセスが不均一なポアソンプロセスと見なされるわけではありません。

その最後の問題を最初に扱いましょう。区間均一ポアソン過程を考え ギャップは指数分布に従う傾向があります。それを、より均等な間隔を維持する傾向があるプロセス、「層別ランダム」プロセスと比較してみましょう。これは、間隔を重複しない1000個のビンに分割し、各ビン内で一様にランダムな1つのポイントを選択することによって作成されます。各プロセスの単一の実現からのこれらの推定によって示唆されるように、それらは同じ一次強度を持っています:[01]

図1

これらのプロセスは、連続する値の間隔を調べることで簡単に区別できます。

図2

確かに、特定の形式の「クラスタリング」は、2次の強度で特徴付けることができますが、すべてではありません。クラスタリングは、次の2つの任意の組み合わせを意味します。

  1. 位置近くの「1次」クラスタリングは、すべての実現にわたって近傍に多くのポイントがある傾向があることを意味します。ss

  2. 位置近くの「2次」クラスタリングとは、近い点の外観が、近く他の位置にある点の外観と関連付けられることを意味しsss

これは微妙に聞こえるので、いくつかの例を比較してみましょう。私は2つのプロセスの実現を生成しました。1つは単純に不均一で、間隔方が間隔 5倍)と、同様に不均一ですがクラスター化されたものです。間隔 生成します。後者を生成するために、指数変量シーケンスを作成し、それらの5番目ごとにを乗算しそれらの累積合計を計算し最終的にそれらの合計の2倍で除算して配置しました範囲内のそれら 間隔のプロセス01/2]1/21]01/2]dバツ100バツ01/2]1/21]前と同じように、均一なポアソン過程です。これにより、4つのポイントのグループが密集し、すべてが互いに離れるプロセスが生まれました。ただし、これらのポイント間のギャップはランダムであるため、これらのクラスターが発生する場所は、実現ごとに同じではない傾向あります。プロセスの複数の実現を表示する機会がある場合、これは不均一性(1つの実現から次へと持続する)をクラスタリング(必ずしも固定された場所ではなく、どこでも発生する)から区別する1つの方法です。

図3

各プロセスの実現は、下部に敷物プロットとして表示されます。ポイントは、ペアの散布図です。つまり、高さは、右側の次のポイントまでのギャップをグラフ化します。散布図は2つのプロセスを明確に区別します。バツdバツ


返信いただきありがとうございます。これは確かに私の混乱のほとんどを解消しました。しかし、それはまた私にとって別の質問を生み出し、私はこれを正しくしたいのです。あなたが言ったことから、データ生成プロセスがわからず、ポイントプロセスの実現が1つしかない場合、Egeによって言及されているように、1次の不均一性と2次の依存構造は常に区別できません。
davidolohowski

最近傍のギャップの分析はそれらを区別するのに役立つので、私はその結論に同意しません。多くの場合、それらの現象を区別するのは難しいかもしれませんが、場合によってはそうすることが確実に可能であることに同意します。
whuber

私は私が何を意味するのか十分に明確ではなかったと思います。たとえば、2番目の例のクラスター化されたポイントプロセスなど、私が何も知らないポイントプロセスのデータセットが1つしかない場合です。この場合、一次の不均一性と二次の依存構造を区別する方法がないように思えます。非常に詳細な1次強度関数を当てはめて、プロセスと最も近い隣接ギャップを記述することは可能に思えます。もちろんそれはオーバーフィットです。それにもかかわらず、それは私の主張を証明しているようです。
davidolohowski

1
妥当な仮定があれば、単一のポイントパターンを使用して、ポイント間の相互作用による不均一性と「実際の」クラスタリング(およびより簡単に抑制)を分離することに運があることができることに同意します。ただし、常に縮退のケースを参照して、基礎となるプロセスが不均一なポアソンであり、観測された点に実質的に点の質量があると言うことができるため、数学的な意味では、さらなる仮定なしに、本当に進歩することはできないと思います。もちろん、これは実用的な観点からは興味をそそらないものであり、私が何らかの方法で主張している観点からはそうではありません。
Ege Rubak

1
@Egeその分析をありがとう。あなたが説明している極端なモデルは、標準的な方法(AIC、交差検証など)で他の簡潔なモデルと比較できる一種の高パラメーター数の「飽和」モデルであり、それにより、根本的なプロセスの性質についての客観的で情報に基づいた意見を開発する。
whuber

2

大まかに言うと、あなたの理解は正しいように聞こえます。特に、単一の点パターンに基づいて「一次の不均一性」と「点間の相互作用による二次のクラスタリング」を区別することは基本的に不可能であるというのは正しいことです。


返信ありがとうございます。これが事実である場合、一次の不均一性の影響を除外した後、二次依存統計、たとえばペア相関関数を取得する方法はありますか(一次強度を説明するためにいくつかのモデルを使用していると仮定)。さらに、一次強度関数のモデリングが過剰であるかどうかを判断する一般的な方法はありますか?
davidolohowski

オーバーフィットについて一般的に言うことは難しいです。一次不均一性が存在する場合のペア相関関数などの二次統計を考慮することは、実際に可能です。疑似定常性(2次強度再重み付け定常性)のような追加の仮定が必要です。spatstat本の (無料サンプル)第7章(特にセクション7.10)に詳細があります。免責事項:私は共著者なので、これを参照として使用することに偏っています。他にもたくさんの参照があります。
Ege Rubak
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.