この離散分布(再帰的差分方程式)の名前は何ですか?


11

コンピューターゲームでこのディストリビューションに出会い、その動作についてもっと知りたいと思いました。これは、特定の数のプレーヤーアクションの後に特定のイベントを発生させるかどうかの決定に基づいています。これ以上の詳細は関係ありません。他の状況にも当てはまるようですが、計算が簡単でロングテールがつくので面白かったです。

ステップごとに、ゲームは均一な乱数ます。場合、その後、イベントがトリガされます。イベントが一度発生すると、ゲームはリセットされ、シーケンスを再度実行します。この問題のイベントの1つの発生にのみ興味があります。これは、ゲームが使用しているディストリビューションを表しているためです。(また、複数の発生に関する質問は、単一の発生モデルで回答できます。)0 X < 1 、X < P N N = 0n0X<1X<p(n)n=0

ここでの主な「異常」は、この分布の確率パラメーターが時間の経過とともに増加するか、言い換えれば、しきい値が時間の経過とともに増加することです。この例では直線的に変化しますが、他のルールを適用できると思います。ステップまたはユーザーによるアクションの後、n

p(n)=kn

ある定数。ある点、p(n _ {\ max})\ geq 1が得られます。イベントはそのステップで発生することが保証されているだけです。0<k<1nmaxp(nmax)1

私はそれを決定することができました

F n = p n + F n - 1 [ 1 - p n ] f n F n n p n

f(n)=p(n)[1F(n1)]
および PMFおよびCDF。簡単に言うと、イベントが番目のステップで発生する確率は、確率に等しく、前のステップですでに発生している確率よりも小さくなります。
F(n)=p(n)+F(n1)[1p(n)]
f(n)F(n)np(n)

以下は、友人のモンテカルロからのプロットですです。中央値は21、平均は22になります。 k0.003ここに画像の説明を入力してください

これは、私の背景であるデジタル信号処理の1次差分方程式とほぼ同等であり、非常に斬新であることがわかりました。また、は任意の式に従って変化する可能性があるという考えにも興味をそそられます。p(n)

私の質問:

  1. ある場合、このディストリビューションの名前は何ですか?
  2. を参照せずに式を導出する方法はありますか?F n f(n)F(n)
  3. このような離散再帰分布の他の例はありますか?

乱数生成に関する明確なプロセスを編集します。


1
()の代わりに角括弧を選択した理由は何ですか?
Cam.Davidson.Pilon

1
@ Cam.Davidson.Pilon:DSPの背景が潜んでいます。離散時間関数には角括弧を使用する傾向があります。これは不快なものになると思いますので、変更します。
jbarlow

1
想定しているプロセスは、ここでは明確に定義されていないようです。「ステップごとに、ゲームは乱数ます場合、イベントがトリガーされます。」ただし、描画方法については指定しません。プロセスをもう少し正確に説明できれば助かると思います。X X < p n XnXX<p(n)X
枢機卿、

2
@jbarlow:私の以前の発言が不明瞭だったら申し訳ありません。いくつかのに対して場合、0と1の間の一様な乱数は間違いなく小さいため、プロセスがステップを超える可能性はありません。よりいずれかのために。量の関数として非常に密接に呼ばれるものに関連するハザード関数として知られている統計のサブフィールドにおける生存分析0 < K < 1 K - 1つのP N N > 1 / K P N Np(n)=kn0<k<1k1p(n)n>1/kp(n)n
枢機卿、

1
小さい場合、この差分方程式の微分アナログを使用すると、(ではなく)がガウス分布に近いことがわかります。(平均は近くでなければならないこと、例えば、我々のすぐを推論このことから上のいくつかの(強い)制限があることにも。)してくださいノート、、それ以外の場合、がを超えると(最終的にはを超える)、が以下であることは保証されません。F F kF fK1/k=33318k1 F 1p(n)1F1
whuber

回答:


9

ある意味では、あなたがしたことはすべての非負の整数値分布を特徴付けることです。

ランダムプロセスの説明を少し脇に置いて、問題の再帰に焦点を当てましょう。

もし、その後確か。この2番目の再帰を生存関数(は分布持つ書き換えると、 非常に示唆的で扱いやすいものになります。明らかに、 なので、 したがって、シーケンスが値を取り、急激にゼロに収束しない限り、有効な生存関数が得られます(つまり、として単調にゼロに減少)。F n = p n + 1 p nF n 1 S n = 1 F n = PT > n T F S n = 1 F n = 1 p nS nfn=pn(1Fn1)Fn=pn+(1pn)Fn1 Sn=1Fn=P(T>n)TFS n = n k = 01 p k

Sn=1Fn=(1pn)Sn1,
P 、N、[ 0 1 ] のn
Sn=k=0n(1pk).
(pn)[0,1]n

すなわち、

命題:値を取るシーケンスは、場合に限り、非負整数の分布を決定しそして、そのようなすべての分布には対応するシーケンスがあります(ただし、一意ではない場合もあります)。、[ 0 1 ] - Σ N = 0ログ1 - PのN= (pn)[0,1]

n=0log(1pn)=,

したがって、質問で書かれた再帰は完全に一般的です。非負の整数値の分布には、対応するシーケンス 、値はです。、[ 0 1 ](pn)[0,1]

ただし、その逆は当てはまりません。つまり、有効な分布に対応しない値を持つシーケンスがあります。(特に、検討全てに対してとのために)。(pn)[0,1]0<pn<1nNpn=0n>N

しかし、待ってください、まだまだあります!

私たちは生存分析への接続をほのめかしており、これをもう少し深く調査する価値があります。絶対連続分布と対応する密度持つ古典的な生存分析では、 ハザード関数はとして定義され Ff

h(t)=f(t)S(t).

累積ハザードはその後でことおよび誘導体ショーの単純な分析 このことから、我々はすぐに許容ハザード関数の特徴付けを与えることができます。これは、任意の測定可能な関数であるようにすべてのためのと 。Λ(t)=0th(s)ds

S(t)=exp(Λ(t))=exp(0th(s)ds).
hh(t)0t0th(s)dst

ことに気づくことで、上記の生存関数と同様の再帰が得られますt>t0

S(t)=et0th(s)dsS(t0).

観察特に、我々が選んだことができると各片は幅1であると、このような無限に積分収束すると区分一定です。これにより、 正の整数ごとに値が1の任意の離散的な非負の整数に一致する生存関数が生成されます。h(t)S(t)

ディスクリートケースに接続する

所望の離散一致するように各整数では、我々は、その区分的に一定であるハザード関数を選択しなければならない オン。これは、シーケンスが有効な分布を定義するために必要な条件の2番目の証明になります。S(n)

h(t)=hn=log(1pn),
(n1,n](pn)

小さい場合、 は、連続分布のハザード関数と離散分布のヒューリスティックな関係を提供し、整数。pnlog(1pn)pn=fn/Sn1

追記:最後の注記として、質問の例は、で を 適切に変更し、すべてのに対してを設定しないと、必要な条件を満たしません。f n npn=knfnn=k1fn=0n>k1


1
+1非常に明るい。しかし、追記に関しては、特別な値に対して「適切な切り捨て」が当然のように発生するように思えます。例えば、と私たちが得、より一般的に、と、我々が取得。kk=1/2f=(0,1/2,1/2,0,)k=1/mf(m+1)=f(m+2)==0
whuber

2
@whuber:「適切な切り捨て」が何を意味するのかをより明確に指定する必要がありました。(が1になるように)指定されたポイントでの値を切り捨てる(縮小する)ことを考えていました。私はあなたが言及する場合でもこの概念はまだ有効であると思います、ちょうど切り捨てがの値の変化をもたらさないということです。私はこれを編集ですぐに明らかにしようとするでしょう。ありがとうございました!fnFnfn
枢機卿、

2
すばらしい答えです。これは非常に洞察に富んでいます。この問題が他の分野や概念に関連しているのを見て、私は本当に興味を持った。
jbarlow

1
@jbarlow:ありがとう。お役に立てて嬉しいです!いい質問なので、少し考えてみました。
枢機卿、

8

場合に、我々はいくつかの既知の特性を有します。再帰関係が解けるp(n)=p<1

F(n)=p+F(n1)(1p);F(0)=p

解決策があります

F(n)=P(Nn)=1(1p)n+1
これは、幾何分布です。それはよく研究されています。

のより一般的なケースは、おそらく閉じた形式では計算できないため、既知の分布を持っていない可能性があります。p(n)

その他の場合:

  1. p(n)=pn;p<1;F(0)=p解は 一般的に知られている分布がされていません。
    F(n)=1(1p)Γ(n+1p)Γ(1p)Γ(n+1)
  2. (統計では生存関数と呼ばれます定義します。上記の反復関係は、より単純な形式に減少します: S(n)=1F(n)
    S(n)=(1p(n))S(n1)
  3. あなたの例から、あなたが、関数たい表示され増加することを。選択は、でのブレークのため、分析的には優れていません。数学者と統計学者は滑らかなものを好む。したがって、を提案し あるで1に収束します。このして反復関係を解くと、適切な分析形式が得られます 考慮してください。既知の統計の事実は、 p(n)np(n)=knp>1
    p(n)=1(1p)n+1p<1
    p(0)=pp(n)Sn=1Fn=1p n + 1
    F(n)=1(1p)n+1n!
    Σ iは=0SI=E[N]E[N]=1-PE1-PS(n)=1F(n)=(1p)n+1n!
    i=0S(i)=E[N]
    これは、何らかの計算を覚えている場合、指数のテイラー級数によく似ているため、
    E[N]=(1p)e(1p)

2
カム、それはハザード関数ではなく、むしろ生存関数です。:-)
カーディナル

1
ty、*生存のために編集
Cam.Davidson.Pilon
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.