タグ付けされた質問 「poisson-process」

ポアソンプロセスの理論または適用に関する質問については、統計およびその他の分野で最も広く適用されているポイントプロセスの1つ。

5
待っているパラドックスを説明してください
数年前、私はイベントをカウントするのではなく、イベント間の間隔を測定することで機能する放射線検出器を設計しました。私の想定では、非連続のサンプルを測定する場合、平均して実際の間隔の半分を測定するというものでした。しかし、校正されたソースで回路をテストしたとき、読み取り値が2倍高すぎたため、全間隔を測定していました。 確率と統計に関する古い本の中で、「The Waiting Paradox」というセクションを見つけました。バスが15分ごとにバス停に到着し、乗客がランダムに到着する例を示しました。乗客は平均で15分間待ちます。私は例で示された数学を理解することができず、説明を探し続けています。乗客が完全な間隔を待つようになっている理由を誰かが説明できれば、私はよりよく眠ります。

8
不規則な間隔の時系列をモデル化するためのゴールドスタンダードはありますか?
経済学の分野(私は思う)には、等間隔の時系列用のARIMAとGARCHと、ポイントプロセスのモデリング用のPoisson、Hawkesがあります。 ? (このトピックに関する知識がある場合は、対応するwiki記事も展開できます。) エディション(欠損値と不規則な間隔の時系列について): @Lucas Reisのコメントに答えてください。測定または実現変数間のギャップが(たとえば)ポアソンプロセスのために間隔が空いている場合、この種の正則化の余地はあまりありませんt(i)が、単純な手順が存在します:変数xのi番目の時間インデックス(実現X)、次いで、測定の時間の間のギャップを定義g(i)=t(i)-t(i-1)し、我々は、離散化、g(i)定数を使用しc、dg(i)=floor(g(i)/cそして元の時系列から古い観測値との間のブランク値の数と新しい時系列を作成iし、i+1()IをDGに等しいが、問題は、このことですプロシージャは、観測数よりはるかに多くの欠損データを含む時系列を容易に生成できるため、欠損観測値の合理的な推定は不可能であり、大きすぎる可能性があります。c「時間構造/時間依存など」を削除する 分析された問題の(極端なケースは、c>=max(floor(g(i)/c))不規則な間隔の時系列を規則的に間隔を空けて単純に崩壊させることにより与えられる Edition2(楽しみのためだけ):不規則な間隔の時系列の欠損値またはポイント処理の場合の画像アカウンティング。

2
データがRのポアソン分布に従うかどうかを知る方法は?
私は学部生で、確率クラスのプロジェクトを持っています。基本的に、私は一連の年の間私の国に影響を与えたハリケーンに関するデータセットを持っています。 私の確率ブック(Rの確率と統計)には、データがポアソン分布に従うかどうかを確認する方法の(完全ではない)例があり、これらの3つの基準が守られていることを証明しようとします:(私の本120(基準)122-123例) 1-重複しない間隔での結果の数は独立しています。つまり、時間間隔(0、t]の結果の数は、時間間隔(t、t + h]、h> 0の結果の数とは無関係です。 2-十分に短い間隔での2つ以上の結果の確率は実質的にゼロです。つまり、hが十分に小さい場合、間隔(t、t + h)で2つ以上の結果を得る確率は、同じ時間間隔で1つまたはゼロの結果を得る確率と比較して無視できます。 3-十分に短い間隔または小さな領域での正確に1つの結果の確率は、間隔または領域の長さに比例します。言い換えると、長さhの区間における1つの結果の確率はlambda * hです。 ただし、基準3は「演習」として残されています。 A-誰かが私のデータセットがポアソン分布に従うかどうかを確認するためのより「簡単な」方法があるかどうか教えてもらえますか? B-誰かが私に基準1と3をある種の例で説明してもらえますか(Rの場合は素晴らしい)。 ありがとう! 注:長い投稿で申し訳ありません。また、データを変換して、次のようなテーブルを作成する必要があります。 number of hurricanes | 0 | 1 | 2 etc. ----------------------------------------- total years that have | | | that number of hurricanes | | |

2
ポアソン分布を使用したプロセスのモデリングからネガティブ二項分布を使用するように切り替えますか?
\newcommand{\P}{\mathbb{P}}設定された期間複数回発生する可能性があるランダムプロセスがあります。このプロセスの既存のモデルからのデータフィードがあり、期間発生する多数のイベントの確率を提供します。この既存のモデルは古く、推定エラーのためにフィードデータでライブチェックを実行する必要があります。データフィードを生成する古いモデル(残りの発生するイベントの確率を提供している)は、ほぼポアソン分布です。TTT0≤t&lt;T0≤t&lt;T0 \leq t < Tnnnttt そのため、異常/エラーをチェックするために、残り時間とし、残り時間発生するイベントの総数とします。古いモデルは、推定値意味します。したがって、という仮定では、次のようになります。 古いモデル(observations)の出力から イベントレートを導出するには、状態空間アプローチを使用して、次のように状態関係をモデル化します tttXtXtX_ttttP(Xt≤c)P(Xt≤c)\P(X_t \leq c)Xt∼Poisson(λt)Xt∼Poisson⁡(λt)X_t\sim \operatorname{Poisson}(\lambda_{t})P(Xt≤c)=e−λ∑k=0cλktk!.P(Xt≤c)=e−λ∑k=0cλtkk!. \P(X_t \leq c) = e^{-\lambda}\sum_{k=0}^c\frac{\lambda_t^k}{k!}\,. λtλt\lambda_tytyty_{t}yt=λt+εt(εt∼N(0,Ht)).yt=λt+εt(εt∼N(0,Ht)). y_t = \lambda_t + \varepsilon_t\quad (\varepsilon_t \sim N(0, H_t))\,. 進化に状態空間[一定速度減衰]モデルを使用して古いモデルから観測値をフィルター処理し、フィルター処理された状態を取得し、推定イベント頻度の異常/エラーにフラグを立てます。フィードのデータであれば。 E (λ T | Y T)E (λ T | YのT)&lt; Y Tλtλt\lambda_tE(λt|Yt)E(λt|Yt)E(\lambda_t|Y_t)E(λt|Yt)&lt;ytE(λt|Yt)&lt;ytE(\lambda_t|Y_t) < y_t このアプローチは、全期間にわたって推定イベントカウントのエラーを検出するのに非常にうまく機能しますが、別の期間0 \ leq t &lt;\ sigma where \ …

1
Rを使用してポアソン過程を推定する方法は?(または:NHPoissonパッケージの使用方法?)
イベントのデータベース(日付の変数)と関連する共変量があります。 イベントは、パラメータがいくつかの共変量の未知の(ただし線形の可能性がある)関数である非定常ポアソンプロセスによって生成されます。 NHPoissonパッケージはこの目的のためだけに存在すると思います。しかし、15時間の失敗した研究の後、私はまだそれを使用する方法を知ることに近づいていません。 ヘック、私は両方の参考書を読んでみました:Coles、S.(2001)。極値の統計モデリングの紹介。スプリンガー。Casella、G. and Berger、RL、(2002)。統計的推論。ブルックス/コール。 fitPP.funのドキュメントにある1つの例は、私の設定に合わないようです。私には極端な価値はありません!むき出しのイベントがあります。 誰もが、パラメータを持つポアソン過程フィッティングの簡単な例で助けを私にしてくださいすることができ単一の共変量を持つX、および仮定を、そのλ = λ 0 + α ⋅ X?私はの推定に興味λ 0とα。イベントの時間(たとえば、任意の時間t 0の後の秒単位で測定)を含む2列のデータセットと、共変量Xの値を含む別の列を提供します。λλ\lambdaXXXλ=λ0+α⋅Xλ=λ0+α⋅X\lambda = \lambda_0 + \alpha \cdot Xλ0λ0\lambda_0αα\alphat0t0t_0XXX

1
生存分析とポアソン回帰の違いは何ですか?
特定のユーザーのサイトへの訪問数を使用して、古典的な解約予測問題に取り組んでいます。ポアソン回帰は、そのユーザーの将来のエンゲージメントをモデル化するための適切なツールだと思いました。そのとき、サバイバル分析とハザードモデリングに関する本に出くわしましたが、どのテクニックが最適かわかりません。 両方のトピックを同時に調査したくないので、過去のデータと人口統計を使用してユーザーエンゲージメントをモデル化するのに最適なものは何ですか?

1
フィッシャーの厳密検定と超幾何分布
私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。 &gt; soda_gender f m n 0 5 y 5 0 明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。 Rでフィッシャーの正確検定を実行すると、次の結果が得られます。 &gt; fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。 フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。 。この観察の可能性は何ですか?この質問に答えるために、次のコマンドを使用しました。 …

1
まれなイベントをどのように予測しますか?
私は保険リスク予測モデルの開発に取り組んでいます。これらのモデルは、航空会社のノーショー予測、ハードウェア障害検出などの「まれなイベント」のものです。データセットを準備していたため、分類を適用しようとしましたが、否定的なケースの割合が高いため、有用な分類子を取得できませんでした。 私は高校の統計コース以外に統計とデータのモデリングの経験があまりないので、ちょっと混乱しています。 最初に思ったように、私は不均質なポアソンプロセスモデルを使用することを考えています。イベントデータ(日付、緯度、経度)に基づいて分類し、特定の場所の特定の日の特定の時間におけるリスクの可能性を適切に推定しました。 知りたいのですが、まれなイベントを予測するための方法論やアルゴリズムは何ですか? この問題に取り組むためのアプローチとして何をお勧めしますか?

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE &lt;- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
独立したポアソンプロセスが他のプロセスを追い抜く確率
他のstackexchangesで以前に別の方法でこの質問をしたので、多少再投稿して申し訳ありません。 私は教授と2人の博士課程の学生に、明確な答えなしに尋ねました。最初に問題を述べ、次に私の潜在的な解決策と私の解決策の問題を述べます。テキストの壁に申し訳ありません。 問題: 二つの独立したポアソン処理想定及びRを用いて、λ Rおよびλ M同じ間隔で、対象λ R &gt; λ M。プロセスMの合計出力がプロセスRプラスDの合計出力よりも大きい、つまり、P (M &gt; R + D )の任意の時点で、時間が無限大になる傾向がある確率はどのくらいですか。例で説明するために、2つのブリッジRとMを平均してλMMMRRRλRλR\lambda_RλMλM \lambda_MλR&gt;λMλR&gt;λM\lambda_R>\lambda_MMMMRRRDDDP(M&gt;R+D)P(M&gt;R+D)P(M>R+D)RRRMMMおよび λ Mの車がブリッジ上ドライブ R及び M間隔ごとにそれぞれ、および λ R &gt; λ M。Dの車はすでに橋 Rを運転しており、どの時点でも合計で Rよりも多くの車が橋 Mを運転した確率はどれくらいですか。λRλR\lambda_RλMλM\lambda_MRRRMMMλR&gt;λMλR&gt;λM\lambda_R>\lambda_MDDDRRRMMMRRR この問題を解決する私の方法: まず、2つのポアソンプロセスを定義します。 M(I)∼Poisson(μM⋅I)R(I)∼Poisson(μR⋅I)M(I)∼Poisson⁡(μM⋅I)R(I)∼Poisson⁡(μR⋅I)M(I) \sim \operatorname{Poisson}(\mu_M\cdot I ) \\ R(I) \sim \operatorname{Poisson}(\mu_R\cdot I ) \\ 次のステップは、与えられた数の間隔Iの後にを表す関数を見つけることです。このような場合に起こるM (I )&gt; K + Dの出力に条件をR (I …

2
ポアソンプロセスの総期待定理
2つの独立したポアソンプロセスとがあり、それぞれ到着率がとです。これで、マージされたプロセスの次のアイテムの到着予定時刻はです。AAABBBλAλA\lambda_AλBλB\lambda_B1λA+λB1λA+λB\frac {1}{\lambda_A+\lambda_B} が結合されたプロセスの次のアイテムの到着時間であり、またはがプロセスまたはからのアイテムであるイベントであると仮定すると、総期待の法則を使用して、TA+BTA+BT_{A+B}{X=A}{X=A}\{X=A\}{X=B}{X=B}\{X=B\}AAABBB E( TA + B)= E(TA + B∣ X= A )P [ X= A ] + E(TA + B∣ X= B )P [ X= B ]= 1λあλあλあ+ λB+ 1λBλBλあ+ λB= 2λあ+ λBE(TA+B)=E(TA+B∣X=A)P[X=A]+E(TA+B∣X=B)P[X=B]=1λAλAλA+λB+1λBλBλA+λB=2λA+λB \begin{align} \mathbb{E}(T_{A+B}) &= \mathbb{E}( T_{A+B} \mid X =A )\mathbb{P}[X = A] + \mathbb{E}( T_{A+B}\mid X =B)\mathbb{P}[X …

2
2つの依存する非均質ポアソンプロセスからのイベント数の分布を決定するためのシミュレーションに代わるものはありますか?
サッカーの試合で得点付けられたゴールの分布の「最先端」のモデルは、ディクソンとロビンソン(1998)の 2つの主要な現象を説明する「アソシエーションサッカーの試合の誕生プロセスモデル」のモデルです。 1)試合開始時よりも試合終了時に得点が増える(両チームの疲労によるものと推測される) 2)スコアリングレートは、無数のリードを持つチームや、勝利のために敗北するリスクを負うのではなくドローをプレーすることを好むチームなど、無数の理由により現在のスコアラインに依存します。 モデルは、試合でホームチームとアウェーチームが獲得したゴールが、不均一なポアソンプロセスに従うことを前提としています。ましょう示す正規化一致に経過時間の間に収まるようにと、 -lengthベクトルホームチームがゴールを得点する時間と表す -lengthベクトル示しますアウェイチームがゴールを決めた時間。一致の可能性はttt000111xxxtH→tH→\vec{t_H}yyytA→tA→\vec{t_A} L(tH→,tA→)=exp(−∫10λ(t)dt)∏xi=1λ(tHi)x!exp(−∫10μ(t)dt)∏yj=1μ(tAj)y!L(tH→,tA→)=exp⁡(−∫01λ(t)dt)∏i=1xλ(tHi)x!exp(−∫01μ(t)dt)∏j=1yμ(tAj)y! L(\vec{t_H},\vec{t_A}) = \exp\left(-\int_0^1 \lambda(t) dt\right)\frac{\prod_{i=1}^{x} \lambda({t_{H}}_i)}{x!}exp\left(-\int_0^1 \mu(t) dt\right) \frac{\prod_{j=1}^{y} \mu({t_{A}}_j)}{y!} ここで、は、時間でのホームチームのスコアリングレートであり、時間均一因子(ホームチームの攻撃能力とアウェイチーム防御能力、ホームアドバンテージなど)と時間不均一因子(たとえば、時間のスコアライン)の組み合わせに依存します。)。同様に。λ(t)λ(t)\lambda(t)ttttttμ(t)μ(t)\mu(t) チームがスコアラインを変更するとスコアリングレート自体がスコアラインに依存するため、2つのプロセスは依存しています。 尤度は指数による積分を数値的に行うことで簡単に評価できます。したがって、モデルのパラメーター(チーム能力、ホームアドバンテージ、時間効果、スコアラインパラメーターなど)を最尤法で計算するのは簡単です。 予測に関して、関心のある明らかな量は次のとおりです。 P(x&gt;y)P(x&gt;y)P(x > y):ホームチームの勝利 P(x&lt;y)P(x&lt;y)P(x < y):アウェイチームの勝利 P(x=y)P(x=y)P(x = y):描画 特定のスコアラインの確率、たとえばP(x=1,y=0)P(x=1,y=0)P(x=1,y=0) 試合の合計ゴールの確率、例えばP((x+y)&lt;2.5)P((x+y)&lt;2.5)P((x+y) < 2.5) 一連のモデルパラメーターを指定してこれらの量を(おおよそ)計算するには、モンテカルロ法を使用してこれらのプロセスに従って一致を生成し、各最終スコアの頻度を計算します。プロセスからのシミュレーションは、比較的単純です。単一のエンベロープする均一なポアソンプロセスからゴールを生成し、拒否サンプリングと組み合わせて、ホームまたはアウェイチームに配信します。 このアプローチの欠点は、明らかに、モンテカルロシミュレーションの計算負荷です。試合が行われているときにリアルタイムで予測を行うことを検討してください。同時に多くのことが発生する可能性があり、すぐに懸念の原因になります。 したがって、私の質問は、(計算を容易にするために精度を犠牲にする近似に依存している場合でも)高い計算コストなど、発生しないと考えられる代替アプローチがあるかどうかです。 明確にするために、私はすでにマルチスレッドCで記述したモンテカルロシミュレーションを効率的に実装する方法に関する(基本的な)提案を探していません。非常に高い受け入れ率を達成します。劇的なパフォーマンス向上の余地がまだあると思われる場合は、もちろん私はすべて耳を傾けていますが、根本的に異なるアプローチを探しています!

2
非整数パラメーターによるガンマ分布の動機
Erlang分布は、ポアソンプロセスで事前定義された数のイベントが発生するまでの待機時間、または事前定義された数の指数確率変数の合計に関して、簡単に解釈できます。ガンマ分布は、非整数パラメーターを許容するため、より一般的ですが、通常、同じ動機が与えられます。私はこの質問が何度か出されたことを知っていますが、満足のいく答えが見当たらないので、もう一度提起します:ガンマ分布ランダム変数を発生させるランダムプロセスの正規または少なくともプロトタイプの例は何ですか?同時にErlang確率変数ではありませんか?

3
間隔内に少なくとも1つのイベントがあるPoissonプロセスのParadox
LET(単一レートのポアソン過程におけるイベントの数であるの長さの間隔内で)。間隔内で少なくとも1つのイベントが観測されたことがわかっているので、間隔内にさらにイベントがある確率を見つけたいと思います。XTXTX_Tλ=1λ=1\lambda = 1TTT 私の直感は、です。Pr(XT&gt;1∣XT&gt;0)=Pr(XT&gt;0)Pr(XT&gt;1∣XT&gt;0)=Pr(XT&gt;0)\Pr(X_T > 1 \mid X_T > 0) = \Pr(X_T > 0) 背後にある理論的根拠は 観測されたイベントが間隔の最初から時間tにあった場合、(0、t)または(t、T)の開いた間隔でtttイベントが発生しなかった確率を計算するだけで十分です:\ Pr(X_T = 1 \ mid X_T&gt; 0)= \ Pr(X_t = 0)\ Pr(X_ {Tt} = 0)= e ^ {-t} e ^ {t-T} = e ^ {-T} = \ Pr(X_T = 0 )、(0,t)(0,t)(0, t)(t,T)(t,T)(t, T)Pr(XT=1∣XT&gt;0)=Pr(Xt=0)Pr(XT−t=0)=e−tet−T=e−T=Pr(XT=0)Pr(XT=1∣XT&gt;0)=Pr(Xt=0)Pr(XT−t=0)=e−tet−T=e−T=Pr(XT=0)\Pr(X_T = …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.