タグ付けされた質問 「point-process」

8
不規則な間隔の時系列をモデル化するためのゴールドスタンダードはありますか?
経済学の分野(私は思う)には、等間隔の時系列用のARIMAとGARCHと、ポイントプロセスのモデリング用のPoisson、Hawkesがあります。 ? (このトピックに関する知識がある場合は、対応するwiki記事も展開できます。) エディション(欠損値と不規則な間隔の時系列について): @Lucas Reisのコメントに答えてください。測定または実現変数間のギャップが(たとえば)ポアソンプロセスのために間隔が空いている場合、この種の正則化の余地はあまりありませんt(i)が、単純な手順が存在します:変数xのi番目の時間インデックス(実現X)、次いで、測定の時間の間のギャップを定義g(i)=t(i)-t(i-1)し、我々は、離散化、g(i)定数を使用しc、dg(i)=floor(g(i)/cそして元の時系列から古い観測値との間のブランク値の数と新しい時系列を作成iし、i+1()IをDGに等しいが、問題は、このことですプロシージャは、観測数よりはるかに多くの欠損データを含む時系列を容易に生成できるため、欠損観測値の合理的な推定は不可能であり、大きすぎる可能性があります。c「時間構造/時間依存など」を削除する 分析された問題の(極端なケースは、c>=max(floor(g(i)/c))不規則な間隔の時系列を規則的に間隔を空けて単純に崩壊させることにより与えられる Edition2(楽しみのためだけ):不規則な間隔の時系列の欠損値またはポイント処理の場合の画像アカウンティング。

1
ポイントプロセス間の相互相関の分析
統計的に妥当かどうかを知るために、私が使用している分析方法に関するアドバイスをお願いします。 2つのポイントプロセスおよびを測定し、決定したいイベントが何らかの形でイベントと相関している場合T1= t11、t12、。。。、t1nT1=t11、t21、。。。、tn1T^1 = t^1_1, t^1_2, ..., t^1_nT2= t21、t22、。。。、t2mT2=t12、t22、。。。、tm2T^2 = t^2_1, t^2_2, ..., t^2_mT1T1T^1T2T2T^2 文献で見つけた方法の1つは、相互相関ヒストグラムを作成する方法です。各について、特定の時間枠(前後)に含まれるすべてのイベントに対する遅延を見つけます。)、その後、これらすべての遅延のヒストグラムを作成します。t1ntn1t^1_nT2T2T^2t1ntn1t^1_n 2つのプロセスが相関していない場合、イベントの後(または前)ににイベントが発生する確率はすべての遅延で等しくなるため、フラットなヒストグラムが期待されます。一方、ヒストグラムにピークがある場合、これは、2点プロセスが何らかの形で互いに影響し合っている(または、少なくとも何らかの共通の入力がある)ことを示唆しています。T2T2T^2T1T1T^1 さて、これは素晴らしくて良いですが、ヒストグラムにピークがあるかどうかをどのように判断するのですか(特定のデータセットについては明らかにフラットであると言わなければなりませんが、それでも統計的な方法があるといいでしょうそれを確認する)? それで、ここで私がやったこと:をそのままにして「シャッフル」バージョンを使用して、ヒストグラムを数回(1000)生成するプロセスを繰り返しました。をシャッフルするには、すべてのイベント間の間隔を計算し、シャッフルし、それらを合計して新しいポイントプロセスを再構成します。RIでは、これを次のように行うだけです。T1T1T^1T2T2T^2T2T2T^2 times2.swp <- cumsum(sample(diff(times2))) そのため、1000個の新しいヒストグラムが作成され、と比較したのイベントの密度が表示されます。T2 ∗T2∗T^{2*}T1T1T^1 これらのヒストグラムの各ビンについて(それらはすべて同じようにビン化されます)、ヒストグラムの95%の密度を計算します。言い換えれば、たとえば、時間遅延5ミリ秒で、シャッフルされたポイントプロセスの95%で、T ^ 1のイベントの後にT ^ {2 *}のイベントを見つける確率xがあります。T2∗T2∗T^{2*}T1T1T^1 その後、すべての時間遅延に対してこの95%の値を取得し、「信頼限界」として使用します(おそらくこれは正しい用語ではありません)。したがって、元のヒストグラムでこの制限を超えるものはすべて「真」と見なすことができますピーク"。 質問1:この方法は統計的に正しいですか?そうでない場合、この問題にどのように取り組みますか? 質問2:もう1つ見たいのは、データの相関関係に「より長い」タイプがあるかどうかです。たとえば、2つのポイントのプロセスでイベントの発生率に同様の変化がある場合があります(これらの発生率はまったく異なる可能性があることに注意してください)が、その方法はわかりません。ある種のスムージングカーネルを使用して各ポイントプロセスの「エンベロープ」を作成し、2つのエンベロープの相互相関分析を実行することを考えました。他のタイプの分析を提案していただけますか? この非常に長い質問に感謝します。

3
2D正方形の点の分布の均一性を測定する
2Dの正方形があり、その中に一連のポイントがあります。たとえば、1000ポイントです。正方形内のポイントの分布が広がっているか(または多かれ少なかれ均一に分布しているか)、または正方形内のいくつかのスポットに集まる傾向があるかどうかを確認する方法が必要です。 これを決定するための数学的/統計的(プログラミングではない)方法が必要です。私はググって、適合度、コルモゴロフなどのようなものを見つけました、そしてこれを達成する他のアプローチがあるのか​​と思っています。クラスペーパーにはこれが必要です。 入力:2D正方形、および1000ポイント。出力:はい/いいえ(はい=均等に広がる、いいえ=一部のスポットに集まる)。

1
周波数が大きく異なる点プロセスの四角形を構築する方法は?
複数のポイントプロセス(または1つのマークされたポイントプロセス)でクアドラットカウント分析を実行し、いくつかの次元削減手法を適用したいと考えています。 マークは均等に分散されていません。つまり、非常に頻繁に表示されるマークもあれば、非常にまれなマークもあります。したがって、2Dスペースを通常のグリッドで単純に分割することはできません。マークの頻度が高くなると、頻度の低いマークが「圧倒」され、外観がマスクされてしまうためです。 したがって、各セルに最大N個のポイントが含まれるようにグリッドを構築しようとしました(これを行うには、各セルを4つの小さい(同じサイズの)セルに再帰的に分割し、セルがN個を超えるポイントがなくなるまで再帰的にそれ)。 この「正規化」手法についてどう思いますか?そのようなことをする標準的な方法はありますか?

2
さまざまなタイプのイベント間の関係(2D位置によって定義される)を見つける方法は?
同じ期間に発生したイベントのデータセットがあります。各イベントにはタイプ(10未満の異なるタイプがいくつかあります)と場所があり、2Dポイントとして表されます。 イベントの種類や種類と場所の間に相関関係がないか確認したい。たとえば、タイプAのイベントは通常、タイプBのイベントが発生する場所では発生しない可能性があります。あるいは、ある地域では、タイプCのイベントがほとんどあります。 これを実行するためにどのようなツールを使用できますか?統計分析の初心者である私の最初のアイデアは、このデータセットに対して何らかの種類のPCA(主成分分析)を使用して、各タイプのイベントが独自のコンポーネントを持っているか、または一部が同じコンポーネントを共有しているか(つまり、相関していたか)を確認することでした。 私のデータセットは約500'000ポイントであるため、処理が少し難しくなります。(x 、y、t yp e )(x,y,type)(x, y, type) 編集:以下の回答とコメントに記載されているように、このワークショップレポートで詳細に説明されているように、これをマークポイントプロセスとしてモデル化し、Rを使用してすべての重い作業を実行する方法です:http:/ /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html

1
ポイントプロセスの混合と分割
左側の次の図では、密度(強度)が異なるポイントプロセスの2つの実現 λ1λ1\lambda_1そしては、所属する領域の中心に一致するように混合され、強度中央にポイントプロセスを構築します。次に、ランダムに選択されたポイントは、右側に示されているように、そこから抽出された2つのセットです。 質問: です?そして、ですか? 左側の2つがポアソンPPである場合、中央の1つはポアソンPPですか? 右側の2つはどうですか?λ2λ2\lambda_2λλ\lambdaλ=λ1+λ2λ=λ1+λ2\lambda=\lambda_1+\lambda_2λ=λ3+λ4λ=λ3+λ4\lambda=\lambda_3+\lambda_4

2
空間点プロセス:不均一な1次強度関数は2次依存性に影響しますか?
タイトルが示すように、一次強度関数の効果について少し混乱しています。特定の領域でポイントが発生する可能性が高いと言う一次強度関数がある場合、その領域で発生するポイントがはるかに多くなり、ポイントがその領域でクラスター化しているように見え、その後その領域で点パターンがクラスター化されていることを示唆しています。したがって、1次強度の不均一性は2次強度に影響を与えるようです。 私の理解では、一次強度関数は、ポイントが発生する強度の一般的なレベルを指定します。次に、その強度に基づいて、特定の領域のポイントが同じ強度のポアソンプロセスと比較してクラスター化されているか反発的であるかが、2次の強度関数によって決定されます。 私の理解が正しければ、一次強度をできるだけ詳細に記述すれば、どの点パターンも不均一なポアソンプロセスと見なすことができます。しかし、もちろん、それは過剰適合の場合になります。 この理解は正しいですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.