固定間隔の指数加数の数はポアソン


7

固定間隔の独立指数加数がポアソン確率変数として分布していることを証明する最も賢い方法は何ですか?私はそれを一つの方法で行うことができますが、より多くのスタイルポイントを得る別の方法があるかどうか知りたいです。

LET。明確にするために、密度はそれぞれです。ここで、t> 0の場合、K_t = \ {j:S_1 + \ cdots S_j <t <S_1 + \ cdots + S_j + S_ {j + 1} \}を定義します。S1,S2,iidExponential(μ)fS(s)=μeμst>0Kt={j:S1+Sj<t<S1++Sj+Sj+1}

私ができる方法は、指数の結合密度を直接積分することです。たとえば、

P(Kt=1)=P(S1<t<S1+S2)=0tts1μeμs1 μeμs2 ds2 ds1=(μt)eμt.
しかし、別の方法はありますか?

編集:これは、基本的なポアソンプロセスの有名な結果です。この事実は、質問の動機でした。したがって、理想的には、回答はポアソンまたはその他の確率論的プロセスの結果に依存しません。

回答:


8

私は出発点として、均一ポアソン過程の概念を採用することを提案します これはライン上のポイントプロセスです(多くの場合、「タイムライン」と見なされ、「タイム」ラインと呼ばれます)。実現はポイントのセットです。ほぼ確実に、実数の制限されたセットには有限数のポイントしか含まれません。

このプロセスが享受する基本的な特性、つまり分析で繰り返し使用する特性は、

  1. 独立性)任意の2つの互いに素な集合の結果は独立しています。

  2. 均質性)有限測度の測定可能なセットの予想されるポイント数直接比例します 。比例定数はゼロではありません。A|A||A|λ

後で見るように、すべてがこれらのプロパティから流れ出します。

待ち時間

このプロセスの「待機時間」を調べてみましょう。開始時刻、所与経過期間、聞かせて何点の間発生しない可能性であると:間隔内に、ある。検討2 1つはから、もう1つはからへの隣接区間です。独立して、それらの和集合にポイントがない確率は、最初にポイントがない確率と2番目にポイントがない可能性:st0S(s,t)ss+t(s,s+t]rr+sr+sr+s+t

(1)S(r,s+t)=S(r,s)S(r+s,t).

均一性により、間隔をスライドしてもこれらの可能性は同じままです。つまり、すべて、です。特に、を取得してsS(r,t)=S(r+s,t)r=s

S(r,t)=S(0,t)=S(t)

すべてのため、私たちは上の明示的な依存関係をドロップすることができ表記。これを、rr(1)

(2)S(s+t)=S(s)S(t).

同質性により、は連続的(実際には微分可能)でなければならないことが明らかになります。唯一の解が指数関数であることはよく知られています。これを確認する簡単な方法の1つは、の対数が線形であることを考慮することです、結果として、いくつかの数が必要になります。S(2)SS(0)=1κ

log(S(t))=κt.

時間の経過とともには減少する必要があるため、。 エルゴ、すべてのソリューションは次の形式ですSκ<0

S(t)=eκt.

これは、長さ指定された間隔内にポイントが発生しない確率です。t

指数加数

間隔を修正します。均一性により、で始まり(たとえば)で終わると想定できます。ほぼ確実にプロセスの唯一の有限個の点の間隔である私たちはそれらを注文することができ、。 ランダム変数の実現である支配:で、0b(0,b]0<t1<t2<<tnt1T1S

Pr(T1t)=1Pr(T1>t)=1S(t)=1eκt.

T2も同様に独立確率変数であり、もによって管理されます。T2T1S

Pr(T2T1+t)=1S(t)=1eκt,

残りのについても同様です。これは、が質問で説明されているとおりであることを示しています。これは、区間内に収まる「指数加数」の最大数です。これは、確率変数の実現です。Tin(0,b]

N(0,b)=max{i|T1+T2++Tib}.

ポアソン分布

してみましょう整数です。区間正確に点がある確率は何ですか?ポアソンプロセスのエルゴディックプロパティから答えを推測します。直感的に理解できると思います。単位間隔内のプロセスは、任意の単位間隔内のプロセスと同じであり、独立しています。、単一の実現のために変化させ、現れるポイントパターンを調べることにより、プロセスのプロパティを推定できます。特に、は、ポイントの数である時間の制限比率に等しくなければなりません。k0pkk[0,1][0,1][t1,t]t pkN(t)=N(t1,t)区間は等しい。これは、引数がtrueの場合はに等しく、それ以外の場合はであるインジケータ関数を使用して正式に表現できます。[t1,t]kI10

pk=limx1x11xI(N(t)=k)dt.

積分は、間隔に正確にポイントが含まれる場合のと間の合計継続時間ですが、分数の分母はからまでの合計経過時間です。1x[t1,t]k1x

$ N(t)$のグラフを示す図

これは、レートポアソンプロセスの1つの実現に対するプロットです。白い水平線は、縦軸の値を示し、からまで伸びます。灰色の縦線は、この実現においてポイントが発生する時間を示しています。青い点線の縦線は、同じポイントを1単位右にシフトしたものです。赤い実線の曲線は、始まるプロットします。(無限に右に伸びますが、すべてを描くことはできません!)N(t)λ=2.5k=1,2,304N(t)t=1

N(1)=4は、最初の時間単位 4つの点(灰色の線)が現れるためです。のプロットはがそのポイントをピックアップするときなのでが左から右に移動するのに遭遇するたびに、ごとに1ユニットずつ上昇します。それは毎回一個の単位だけ低下これは値を失うことと同じことであるため、青い線が検出された区間から。[0,1]N(t)t[t1,t]tt1[t1,t]

各高さ費やされた時間の割合は、任意の単位間隔に正確にポイントが含まれる確率である推定します。kpkk

区間に点が含まれているとします。右にスライドするので、拾った新しいポイントと落ちた古いポイントを追跡しましょう。 2つの単純な関係がすべてを決定します。[t1,t]k

  1. と間()、予想される新しい点の数はです。(それは同質性です。)tt+dtdt0λdt

  2. ただし、区間内にランダムに配置された点があるため失われると予想される点の数はです。(これも均一性によるものです。)kdtk

ほぼ確実に、多くても1つのポイントが追加または失われます。(そうでない場合、2つ以上のポイントが任意の小さな間隔で出現する可能性に正の下限がありますが、そのような間隔で予期されるポイント数は dt-小で無視できるほど小さい成長。不可能である-この)ため、:発生のゼロでないチャンス持っている唯一の2つの遷移があるからポイントに点からのポイントにポイント。それらの瞬時レートは[t,t+dt]λdtdtkk+1kk1

τ(kk+1)=limdt0+λdtdt=λ

そして、場合、k1

τ(kk1)=limdt0+kdtdt=k.

これは、無限に多くの確率微分方程式系を確立するため、複雑に見えるかもしれません。ただし、プロセスは均一であるため、これらの確率は変化しません。pk

最初にの場合を見てください。が変化する予想レート(つまり、ゼロ)は、状態からへの遷移の予想レートから状態への予想遷移レートを引いたものです。したがって、単純な関係(1)と(2)により、k=0p010k=1 01k=1

(1)p1(λ)p0=0.

これにより、に関してを見つけることができます。p1p0

(3)p1=λp0.

ここで、一般的な状況考え。あり4つの潜在的に変化する遷移、期待してバランスを取る必要がありますすべては:と一方で、それが減少しますし、それを増やします。したがって、簡単な関係(1)と(2)を使用して瞬時レートを計算すると、k>0pkkk+1kk1k+1kk1k

[(λ)pk1(k)pk]+[(k+1)pk+1(λ)pk]=0.

かっこ内の最初の項のバランスが取れていると帰納的に仮定することができます(の場合示したもの)。これにより、かっこ内の2番目の項が自動的にバランスされ、簡単に解が得られます。k=0

(4)pk+1=λk+1pk.

式及びすべての決定換算で:溶液であります(3)(4)pkp0

(5)pk=p0λkk!.

(証明:この式は初期条件および再帰満たします。)(3)(4)

指数パラメータとポアソンパラメータ間の接続

を見つけるには2つの方法があります。p0最初に、指数の待機時間について以前に学習したことを利用できますは、パラメーター指数変数を超える可能性です。これはp0κ 1

(6)p0=eκ.

2つ目は、確率の合計が1になることです。

1=k=0p0λkk!=p0k=0λkk!=p0eλ.

したがって

(7)p0=eλ

機能するユニークな値です。したがって、は完全に明示的になりました。(5)

pk=eλλkk!.

これはポアソン分布です。

等式及びことがわかります(6)(7)

κ=λ.

これは、指数待機時間のパラメーターをポアソン分布のパラメーターに明示的に関連付けます。

理解を深めるためのシミュレーション

最初の図は、正確に推定するのに十分長い時間スパンを示していませんでした。ただし、100倍長い別の実現の一部を検討してください。pkN(t)

長い部分の図

(縦線は非常に多いため、描かれなくなりました。)

以下は、各費やされた時間の割合です。その下には、ポアソン分布の比率があります。k(2.5)

         0      1      2      3      4      5      6      7      8     9
y   0.0745 0.2068 0.2637 0.2215 0.1290 0.0660 0.0235 0.0128 0.0016 6e-04
fit 0.0821 0.2052 0.2565 0.2138 0.1336 0.0668 0.0278 0.0099 0.0031 9e-04

合意は明らかです。ただし、これはまだ実現の初期段階にすぎないため、まだ不完全です。


これは、R図を生成するために使用されるコードです。を試してlambdanこの分析の感触をつかんでください。

lambda <- 2.5               # Poisson intensity
n <- 1000                   # Number of points to realize
x <- cumsum(rexp(n, lambda))# Accumulate the waiting times

# Compute the proportion of times for each `k` and compare to the Poisson distribution.
f <- ecdf(x)                # The ECDF does the work of computing N(t)
b <- max(x)
u <- seq(1, b, length.out=10*n)
y <- table(round(n*(f(u) - f(u-1)), 4))
y <- y / sum(y)
fit <- dpois(as.numeric(names(y)), lambda)
round(rbind(y, fit), 4)

# Plot N(t)
y.max <- max(as.numeric(names(y)))
curve(ifelse(x >= 1 & x <= b, n*(f(x) - f(x-1)), NA), 0,b, ylim=c(0, y.max*1.01),
      n=max(10001, 10*n), xlab="t", ylab="", col="#00000080",
      yaxp=c(0, y.max, y.max), bty="n", yaxt="n", yaxs="i")
rect(0, 0, b, y.max, col="#f4f4f4", border=NA)
abline(h=0:y.max, col="White")
if (n < 1000) {
  abline(v=x, lty=1, col="Gray")
  abline(v=x[x <= b-1]+1, lty=3, col="Blue")
}
curve(ifelse(x >= 1 & x <= b, n*(f(x) - f(x-1)), NA), add=TRUE,
      n=max(10001, 10*n), lwd=2, col="#802020")

つまり、スライドさせているのではなく、毎回ずつインクリメントしていますよね 回答は受け付けますが、後で質問があるかもしれません。t1
テイラー

どちらでもかまいませんが、実際には、以上の実際の値を持たせるという意味で「スライド」しています。これは、理論的な扱い(合計ではなくで積分する)とコード(経験累積分布関数では、整数値だけでなく、引数のすべての実数値を考慮します)に現れます。1tecdf
whuber

私を投げた「とは独立して」のようなものを言う早い段階でポアソン過程セクション内の1件の括弧のコメントがあります
テイラー

2つの重複区間のポイント数は独立していないことは事実です。ただし、この独立性の欠如は、期待に基づく分析には影響しません。
whuber

確率過程を調べるこのスライディングウィンドウアプローチの詳細はどこで確認できますか?
テイラー、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.