設定された期間複数回発生する可能性があるランダムプロセスがあります。このプロセスの既存のモデルからのデータフィードがあり、期間発生する多数のイベントの確率を提供します。この既存のモデルは古く、推定エラーのためにフィードデータでライブチェックを実行する必要があります。データフィードを生成する古いモデル(残りの発生するイベントの確率を提供している)は、ほぼポアソン分布です。T0≤t<Tnt
そのため、異常/エラーをチェックするために、残り時間とし、残り時間発生するイベントの総数とします。古いモデルは、推定値意味します。したがって、という仮定では、次のようになります。
古いモデル(observations)の出力から
イベントレートを導出するには、状態空間アプローチを使用して、次のように状態関係をモデル化します
tXttP(Xt≤c)Xt∼Poisson(λt)
P(Xt≤c)=e−λ∑k=0cλktk!.
λtytyt=λt+εt(εt∼N(0,Ht)).
進化に状態空間[一定速度減衰]モデルを使用して古いモデルから観測値をフィルター処理し、フィルター処理された状態を取得し、推定イベント頻度の異常/エラーにフラグを立てます。フィードのデータであれば。
E (λ T | Y T)E (λ T | YのT)< Y TλtE(λt|Yt)E(λt|Yt)<yt
このアプローチは、全期間にわたって推定イベントカウントのエラーを検出するのに非常にうまく機能しますが、別の期間0 \ leq t <\ sigma where \ sigma <\ frac { 2} {3} T。これを回避するために、負の二項分布を使用するように切り替えて、X_t \ sim NB(r、p)と仮定し、次のようにすると決定しました:
\ P(X_ {t} \ leq c)= p ^ {r} \ sum_ {k = 0} ^ c(1-p)^ {k} \ binom {k + r -1} {r-1}、
ここでパラメータ\ lambdaはrおよびpに置き換えられます0 ≤ T < σ σ < 2T0≤t<σのXT〜NB(R、P)P(XT≤C)=PR C Σ K=0(1-P)K( Kσ<23TXt∼NB(r,p)λRP
P( Xt≤ C )= Pr∑k = 0c(1 − p )k( k+r−1r − 1)、
λrp。これは実装するのが簡単なはずですが、私は解釈にいくつかの困難を抱えているので、私はあなたに助けて欲しいいくつかの質問があります:
1.負の二項分布にp = \ lambdaを設定するだけでp = λいいですか?そうでない場合は、なぜですか?
2.我々が設定できると仮定すると、P = F(\ラムダ)fがどのように正しく設定することができ、いくつかの機能であるRを(我々がフィットする必要がありますrは過去のデータセットを使用して)? p = f(λ )frr
3. rはr、特定のプロセス中に発生すると予想されるイベントの数に依存していますか?
r(およびp)の推定値を抽出するための補遺:
この問題が実際に逆転し、各プロセスのイベントカウントがある場合、および最尤推定量を採用できることを認識しています。もちろん、最尤推定量は、サンプル分散がサンプル平均よりも大きいサンプルに対してのみ存在しますが、これが当てはまる場合、独立した同一分布の観測の尤度関数を設定できます as:
そこから対数尤度関数を次のように書くことができます:
p N k 1、k 2、… 、k N L (r 、p )= N ∏ i = 1 P(k i ; r 、p )、l (r 、p )= N ∑ i = 1 ln (Γ (k i + r ))− N ∑ irpNk1、k2、… 、kN
L (r 、p )= ∏i = 1NP( k私; r 、p )、
l (r 、p )= ∑i = 1Nln(Γ (k私+ r ))− ∑i = 1Nln(k私!)− Nln(Γ (r ))+ ∑i = 1Nk私ln(p )+ Nr ln(1 − p )。
最大値を見つけるには、とに関する偏微分を取り、それらをゼロに等しく設定します。
設定および設定ようになります:
rp∂rl (r 、p )∂pl (r 、p )= ∑i = 1Nψ (k私+ r )− Nψ (r )+ Nln(1 − p )、= ∑i = 1Nk私1p− Nr 11 − p。
∂rl (r 、p )= ∂pl (r 、p )= 0p = ∑i = 1Nk私(Nr + ∑Ni = 1k私)、∂rl (r 、p )= ∑i = 1Nψ (k私+ r )− Nψ (r )+ Nln(rr + ∑Ni = 1k私N) =0。
この方程式は、ニュートンまたはEMを使用しても、閉じた形のrに対して解くことができません。ただし、この状況ではこれは当てはまりません。過去のデータを使用して静的およびを取得する
ことは
できますが、これは実際のプロセスではまったく使用されませんが、ポアソンを使用した場合と同様に、これらのパラメーターを時間内に調整する必要があります。
rp