統計的に妥当かどうかを知るために、私が使用している分析方法に関するアドバイスをお願いします。
2つのポイントプロセスおよびを測定し、決定したいイベントが何らかの形でイベントと相関している場合
文献で見つけた方法の1つは、相互相関ヒストグラムを作成する方法です。各について、特定の時間枠(前後)に含まれるすべてのイベントに対する遅延を見つけます。)、その後、これらすべての遅延のヒストグラムを作成します。
2つのプロセスが相関していない場合、イベントの後(または前)ににイベントが発生する確率はすべての遅延で等しくなるため、フラットなヒストグラムが期待されます。一方、ヒストグラムにピークがある場合、これは、2点プロセスが何らかの形で互いに影響し合っている(または、少なくとも何らかの共通の入力がある)ことを示唆しています。
さて、これは素晴らしくて良いですが、ヒストグラムにピークがあるかどうかをどのように判断するのですか(特定のデータセットについては明らかにフラットであると言わなければなりませんが、それでも統計的な方法があるといいでしょうそれを確認する)?
それで、ここで私がやったこと:をそのままにして「シャッフル」バージョンを使用して、ヒストグラムを数回(1000)生成するプロセスを繰り返しました。をシャッフルするには、すべてのイベント間の間隔を計算し、シャッフルし、それらを合計して新しいポイントプロセスを再構成します。RIでは、これを次のように行うだけです。
times2.swp <- cumsum(sample(diff(times2)))
そのため、1000個の新しいヒストグラムが作成され、と比較したのイベントの密度が表示されます。
これらのヒストグラムの各ビンについて(それらはすべて同じようにビン化されます)、ヒストグラムの95%の密度を計算します。言い換えれば、たとえば、時間遅延5ミリ秒で、シャッフルされたポイントプロセスの95%で、T ^ 1のイベントの後にT ^ {2 *}のイベントを見つける確率xがあります。
その後、すべての時間遅延に対してこの95%の値を取得し、「信頼限界」として使用します(おそらくこれは正しい用語ではありません)。したがって、元のヒストグラムでこの制限を超えるものはすべて「真」と見なすことができますピーク"。
質問1:この方法は統計的に正しいですか?そうでない場合、この問題にどのように取り組みますか?
質問2:もう1つ見たいのは、データの相関関係に「より長い」タイプがあるかどうかです。たとえば、2つのポイントのプロセスでイベントの発生率に同様の変化がある場合があります(これらの発生率はまったく異なる可能性があることに注意してください)が、その方法はわかりません。ある種のスムージングカーネルを使用して各ポイントプロセスの「エンベロープ」を作成し、2つのエンベロープの相互相関分析を実行することを考えました。他のタイプの分析を提案していただけますか?
この非常に長い質問に感謝します。