Bayesian Survival Analysis:カプラン・マイヤーの事前記事を書いてください!


20

時刻イベントを使用した、右打ち切りの観測を検討します。時間の影響を受けやすい個人の数はであり、時間のイベントの数はです。i n i i d it1,t2,iniidi

生存関数がステップ関数場合、Kaplan-Meierまたは積推定量は自然にMLEとして発生します。尤度は あり、MLEはです。 L α = Π I1 - α I D I α N I - D I I α I = 1 - D IS(t)=i:ti<tαi

L(α)=i(1αi)diαinidi
α^i=1dini

さて、ベイジアンに行きたいと仮定しましょう。を掛ける前に、ある種の「自然な」ものが必要ですか?L(α)

明らかなキーワードをグーグルで検索して、Dirichletプロセスが事前に適切であることがわかりました。しかし、私が理解している限りでは、それは不連続点事前でもありますか?ti

これは確かに非常に興味深いものであり、私はそれについて学びたいと思っていますが、もっと簡単なものに落ち着くでしょう。思ったほど簡単ではないのではないかと思うようになりました。あなたのアドバイスを求める時が来ました...

事前に感謝します!

PS:私は期待していますどのようにいくつかの精度私は前ディリクレ過程を処理する方法についての説明(可能な限りシンプルなど)に興味を持っています、しかし、私はそれを前に、単純に使用することは可能であるべきだと思う -ですステップの事前は、不連続性がある関数。tは私がαiti

事前にサンプリングされたステップ関数の「グローバルな形状」はt_iに依存すべきではないと思いtiます。これらのステップ関数によって近似される基礎的な連続関数のファミリーがあるはずです。

αiが独立している必要があるかどうかはわかりません(疑わしい)。もしそうなら、これは、前のαiΔti=titi1に依存し、その分布をA(\ Delta t)で表すA(Δt)と、A(Δ1)独立したA(Δ2)変数による変数は、A(Δ1+Δ2)変数です。ここでは、log- Γ変数が役立つようです。

しかし、ここでは基本的に立ち往生しています。すべての答えをこの方向に向けたくなかったため、最初はこれを入力しませんでした。最終的な選択を正当化するのに役立つ参考文献参照の回答を特に感謝します。


MLEでは、a^i=1dimimi何ですか?それはタイプミスですか?あなたに意味ですかni
stachyra 14年

はい、もちろんです。修正します。ni
エルビス14年

1
このslidedeck、私はこの見つかった論文を、また、この持っているの著者紹介を。それらがソースとして十分でない場合、彼ら自身の参照はおそらくそうでしょう。また、階層ディリクレプロセスに関するこのビデオ
ショーンイースター

私はDPの基本的な特徴付けを理解するが、私は前など...また、との基本対策として、具体的には、それを使用する方法も取得しないことに注意
エルビス

その尤度関数は一意ですか?または、他の可能性からKMを取得できますか?
確率論的

回答:


11

尤度関数は関数の積であるため、データはそれらの間に相関の証拠がないことを示していることに注意してください。変数は、時間を考慮して既にスケーリングされていることに注意してください。期間が長いほど、イベントが発生する可能性が高くなり、一般的に大きくなります。dは、私はdはIαididi

ここで「ベイジアンに行く」ための最も基本的な方法は、独立した一様事前確率を使用することです。なお、、これは適切な前になるように-したがって、後方にも適切です。事後分布は、パラメーター独立したベータ分布です。これは、たとえばRの関数を使用して、生存曲線の事後分布を生成するために簡単にシミュレートできます。p(αi)=10<αi<1p(αi)beta(nidi+1,di+1)rbeta ()

これは、「より簡単な」方法についてのあなたの主な質問になると思います。以下は、生存関数の柔軟なKM形式を保持する、より良いモデルを作成するためのアイデアの始まりにすぎません。

KMカーブの主な問題はサバイバル機能にあると思いますが、事前にはありません。たとえば、なぜ値が観測された時点に対応する必要があるのでしょうか?実際のプロセスに基づいて、意味のあるイベント時間に対応するポイントにそれらを配置する方が合理的ではないでしょうか?観測された時点が離れすぎている場合、KMカーブは「滑らかすぎます」。それらが近すぎる場合、KMカーブは「粗すぎる」ことになり、急激な変化を示す可能性があります。「粗すぎる」問題に対処する1つの方法は、ように、相関する前に置くことです。この事前の効果は、近くのパラメーターをより近くに縮小することです。「log-odds」でこれを使用できますtiααiαi+1η-τηI-ηI-12NIDiはIT0T1=N01D1=D01+D02+η=ログα1α および k次のランダムウォークを使用します。一次のランダムウォークでは、対数尤度にという形式のペナルティが導入されます。BayesXソフトウェアには、この種の平滑化に関する非常に優れたドキュメントがあります。基本的に次数kを選択することは、k次の局所多項式を行うようなものです。スプラインが好きな場合は、k = 3を選択します。もちろん、「細かい」タイムグリッドを使用すると、観測のない時点が得られます。しかし、が一部の欠落しているため、これにより尤度関数が複雑になります。たとえば、が3つの「より細かい」間隔に分割された場合ητηη12ndt0t1t00t01t02t10 その後、わかりませんただし、および。したがって、おそらくこれらの「欠損データ」を追加し、EMアルゴリズムまたはVBを使用する必要があります(mcmcパスを下っていない場合)。n02n10d01d02d10n1=n01d1=d01+d02+d10

これがあなたの出発点になることを願っています。


ご意見ありがとうございます(+1)。私は以前はユニフォームを使用していましたが、それを維持すると思います...私の本当の問題はここで公開されているものよりも複雑で、の間に相関があります。興味をそそるこの「ランダムウォークプリオール」を見てみましょう。α
エルビス14年

5

正しい打ち切りを受け入れる生存関数を推定するためにベイジアンに行く問題に直面している読者には、F Mangili、A Benavoli et al。によって開発されたノンパラメトリックベイジアンアプローチをお勧めします。唯一の事前指定は、(精度または強度)パラメーターです。事前情報が不足している場合に、ディリクレプロセスを指定する必要がなくなります。著者は、(1)-生存曲線の堅牢な推定量とその生存確率の信頼できる区間(2)-2つの独立した母集団からの生存の差の検定で、古典的なログランク検定よりもさまざまな利点があります。または他のノンパラメトリック検定。RパッケージIDP​​survivalおよびこのリファレンス:Dirichletプロセスに基づく信頼性の高い生存分析を参照してください 。F Mangili等。生体認証ジャーナル。2014

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.