ポイントプロセス間の相互相関の分析


15

統計的に妥当かどうかを知るために、私が使用している分析方法に関するアドバイスをお願いします。

2つのポイントプロセスおよびを測定し、決定したいイベントが何らかの形でイベントと相関している場合T1=t11t21tn1T2=t12t22tm2T1T2

文献で見つけた方法の1つは、相互相関ヒストグラムを作成する方法です。各について、特定の時間枠(前後)に含まれるすべてのイベントに対する遅延を見つけます。)、その後、これらすべての遅延のヒストグラムを作成します。tn1T2tn1

2つのプロセスが相関していない場合、イベントの後(または前)ににイベントが発生する確率はすべての遅延で等しくなるため、フラットなヒストグラムが期待されます。一方、ヒストグラムにピークがある場合、これは、2点プロセスが何らかの形で互いに影響し合っている(または、少なくとも何らかの共通の入力がある)ことを示唆しています。T2T1

さて、これは素晴らしくて良いですが、ヒストグラムにピークがあるかどうかをどのように判断するのですか(特定のデータセットについては明らかにフラットであると言わなければなりませんが、それでも統計的な方法があるといいでしょうそれを確認する)?

それで、ここで私がやったこと:をそのままにして「シャッフル」バージョンを使用して、ヒストグラムを数回(1000)生成するプロセスを繰り返しました。をシャッフルするには、すべてのイベント間の間隔を計算し、シャッフルし、それらを合計して新しいポイントプロセスを再構成します。RIでは、これを次のように行うだけです。T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

そのため、1000個の新しいヒストグラムが作成され、と比較したのイベントの密度が表示されます。T2T1

これらのヒストグラムの各ビンについて(それらはすべて同じようにビン化されます)、ヒストグラムの95%の密度を計算します。言い換えれば、たとえば、時間遅延5ミリ秒で、シャッフルされたポイントプロセスの95%で、T ^ 1のイベントの後にT ^ {2 *}のイベントを見つける確率xがあります。T2T1

その後、すべての時間遅延に対してこの95%の値を取得し、「信頼限界」として使用します(おそらくこれは正しい用語ではありません)。したがって、元のヒストグラムでこの制限を超えるものはすべて「真」と見なすことができますピーク"。

質問1:この方法は統計的に正しいですか?そうでない場合、この問題にどのように取り組みますか?

質問2:もう1つ見たいのは、データの相関関係に「より長い」タイプがあるかどうかです。たとえば、2つのポイントのプロセスでイベントの発生率に同様の変化がある場合があります(これらの発生率はまったく異なる可能性があることに注意してください)が、その方法はわかりません。ある種のスムージングカーネルを使用して各ポイントプロセスの「エンベロープ」を作成し、2つのエンベロープの相互相関分析を実行することを考えました。他のタイプの分析を提案していただけますか?

この非常に長い質問に感謝します。

回答:


11

この問題を2次元以上で分析する標準的な方法は、リプリーの(クロス)K関数ですが、1次元でも使用しない理由はありません。(Google検索は、参照を掘り下げるのに良い仕事をします。)基本的に、それらの距離のPDFへのヒストグラム近似ではなく、2つの実現における点間のすべての距離のCDFをプロットします。(バリアント、L関数は、2つの一様な無相関プロセスのKとヌル分布の差をプロットします。)これにより、ビンを選択したり、滑らかにするなどの必要性に直面する問題のほとんどがうまく回避されます。通常、シミュレーションによって作成されます。これはRで簡単に実行できます。Rの多くの空間統計パッケージを直接使用するか、この1Dケースに簡単に適合させることができます。ロジャー・ビヴァンズCRANの概要ページにこれらのパッケージがリストされています。「ポイントパターン分析」のセクションを参照してください。


おもしろい...今は少し忙しいですが、間違いなく見ていきます!
ニコ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.