指数分布のML推定(打ち切りデータ付き)


9

生存分析では、rv 生存時間が指数関数的に分布していると想定します。私が持っていることを考えると、今のx 1... X nは IID RVさんの"成果" X Iを。これらの結果の一部のみが実際に「完全に実現」されています。つまり、残りの観察結果はまだ「生きています」。Xix1,,xnXi

分布のレートパラメーター ML推定を実行したい場合、実現されていない観測をコヒーレント/適切な方法でどのように利用できますか?推定に役立つ情報がまだ含まれていると思います。λ

誰かがこのトピックに関する文献を教えてくれませんか?確かに存在します。しかし、トピックに適したキーワード/検索用語を見つけるのに苦労しています。


3
あなたはからと言っているように、あなたは測定を持っているのランダム変数、言うnは1 < n個(関連するランダム変数は、測定時に「死んで」いた、ので)残りながら観察は、「確定」生命の長さを表すn個2 < nの観測値は、測定時に「まだ生きている」確率変数の生存期間ですか?(n 1 + n 2 = nnn1<nn2<nn1+n2=n
Alecos Papadopoulos 2015

1
これは切り捨てられたモデルであり、観測が停止したときに「生きている」確率変数が切り捨てられます。
西安

1
切り捨てられたデータと関連ソースについては、Tobitモデルを確認してください(例:ここ)。
Richard Hardy

2
xi>titi

3
2つの状況の微妙な違いに注意してください。打ち切りが打ち切りと混同されることは珍しくなく、逆もまた同様です。
Alecos Papadopoulos 2015

回答:


16

x1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλxG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtjP(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
l(λ)=rlogλλ(x1++xr+tr+1++tn)
rlogλnlogλTλλ^=rnT
 EDIT   

r=0

l(λ)=nTλ
λλ=0λλ

しかし、いずれの場合でも、その場合のデータからの本当の結論は、いくつかのイベントを取得するまで、さらに時間を待つ必要があるということです...

λeλnTpnp[p¯,1]λlogp=λT

p

P(X=n)=pn0.95    (say)
nlogplog0.95λ
λlog0.95nT.

1
xj>tj
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.