タグ付けされた質問 「survival」

生存時間分析は、イベントデータまでの時間、通常は死ぬまでの時間または障害時間をモデル化します。打ち切りデータは生存分析の一般的な問題です。

1
比例ハザードの仮定
比例ハザードの仮定では、基本的にハザード率は時間とともに変化しないとしています。あれは、HR(t)≡HRHR(t)≡HR\text{HR}(t) \equiv \text{HR}。いつこれを想定できますか?さまざまな時点での危険率が次の場合:2.4,2.36,2.272.4,2.36,2.272.4, 2.36, 2.27 そして 2.032.032.03?比例ハザードを仮定できますか?また、log[h(t|x)]=log[h0(t)]+β1x1+⋯+βpxplog⁡[h(t|x)]=log⁡[h0(t)]+β1x1+⋯+βpxp \log[h(t|\textbf{x})] = \log[h_{0}(t)] + \beta_{1}x_1 + \dots + \beta_{p}x_{p} 推定する必要があるのはなぜですか h0(t)h0(t)h_{0}(t)?私たちが持っている場合h(t|x)h(t|x)h(t|\textbf{x})、なぜ予測子のすべての値をゼロにして取得できないのですか? h0(t)h0(t)h_{0}(t)? 編集。PHの仮定が正しいかどうかを評価する手段が欲しい。
8 survival 


2
臨床試験データを自然史コントロールと比較する方法
コンテキスト:私は、自然史制御を伴う臨床試験のデータを分析する方法を理解することに興味があります。つまり、あるグループの人々(たとえば、疾患の遺伝的リスクがある人々)が採用され、すべてが扱われる臨床試験です薬物、およびそれらの生存率(たとえば、発症時の年齢、またはこの疾患による死亡)が、同じ遺伝的リスクを持つ未治療の歴史的対照の生存率と比較されます。 始める前に、このトピックに触れたFDAガイダンスドキュメント(例:希少疾患:医薬品開発における一般的な問題)を読んだことを認めたいと思います。自然に忍び込むことができる多くの種類のバイアスがあることをよく認識しています歴史の比較と、この理由から、FDAはそのような試験を薬の有効性の証拠として受け入れることはほとんどなく、通常は無作為化試験をはるかに強力な証拠と見なしています。自然史コホートを薬物で治療される将来のコホートと公平に比較​​できるかどうかをどのように決定するかという問題は、重要で複雑な問題です。しかし、それは今日の私の質問のトピックではありません。その代わり、私は、まだはるかに簡単な質問に困惑の問題だということを発見しています場合に自然史のコホートは比較可能で偏りがないと見なされます。統計的に言えば、比較はどのように行われますか? これがシナリオです。 簡単にするために、私の病気には単一の既知の遺伝的原因があり、この遺伝子型の人はある程度の年齢まで完全に健康であり、その後突然病気になったとします。発症年齢は非常に変動しやすく、危険は年齢の関数として変化します。以下に説明するすべてのデータセットの誰もが、この病気を引き起こす遺伝子型を持っています。 データセットAには、架空の臨床試験に参加している人々に関するデータがあります。彼らは1歳で登録し(starting_age)、薬剤で治療され、2番目の年齢(last_age)で病気になる(event == 1)か、または試験から離脱する()まで、さまざまな期間が経過したevent == 0。 「理想的な理想」のシナリオでは、おそらく自然史コホートは、この遺伝子型を持つ多数の人々であり、出生からこの疾患または無関係の原因で死亡するまで続きます。そのようなデータセットは存在しません。代わりに、自然史コホートが何であるかについて2つの可能なオプションを検討してください(BおよびC)... データセットBには、いくつかのランダムな年齢(starting_age)で前向き研究に登録し、薬物治療を受けておらず、2番目の年齢(last_age)になるまで、さまざまな期間、単純に追跡された人々に関するデータがあります。病気(event == 1)または研究を中止(event == 0)。開始年齢の分布とフォローアップの年数は、データセットAと同じ分布に従うとは想定できません。 データセットCには、純粋に遡及的なデータがあります。ここでは将来のフォローアップはありませんでした。私たちは一人一人を単純に観察しました。一部の人々は、いくつかの特定の年齢で病気になることを観察した(してage、そしてevent == 1他の人がまだいくつかの特定の年齢で健康であることを見て(している間)age、およびevent == 0)。 用語を正しく理解していれば、AとBのデータは左打ち切りと右打ち切りと見なされます。Cのデータは、右打ち切りのみと見なされます。Cain 2011で使用されている用語によると、データセットBは「流行しているコホート」であり、データセットCは「インシデントコホート」であると思います。 私の質問は: データが各個人の異なる年齢で左端が切り捨てられている場合、データセットAまたはBの生存関数(またはハザード関数など)を構築するにはどうすればよいでしょうか。 データセットAの人がBまたはCの人よりも有意に長く生存するか、ハザードが著しく低いかをテストするためにどの統計テスト(またはブートストラップ法)が使用されますか? データセットBまたはC しかなく、特定のハザード比に対してN人の個人を対象とした特定の臨床試験の統計的検出力を推定したい場合、どうすればよいでしょうか? (ボーナス質問)人々が、たとえば、年齢の関数としてさまざまなハザードに関連するさまざまな遺伝的変異も持っている場合、その変数を上記の回答にどのように組み込みますか? これまでに試したいくつかのこと: 私はフローラのZ統計[ フローラ1978 ] を検討しましたが、いくつかは同様の状況で適用されましたが、参照として使用されている自然史コホートのサンプリングの差異を考慮していないのではないかと心配しています。 左打ち切り時間の異なる生存分析などの用語のいくつかの異なる組み合わせをグーグル検索し、生存分析:左打ち切りデータ、PROC PHREGを使用した左打ち切りの存続など、同様の問題について説明しているページをいくつか見つけましたが、これらは根本的な原因を説明していません彼らのソリューションの数学。 私はついにCain 2011に出会いました。この記事では、問題を詳細に説明しており、補足として、左切り捨てを処理するためのRコードがあります。左打ち切りを組み込んだMLEに独自の関数を実装しましたが、R survivalライブラリに組み込まれた機能を使用して、左打ち切りはCox比例ハザードモデルですでに処理できると主張していますcoxph(Surv(time=agestart,time2=x,event=cx,type='counting')~bmi)。ここで、Survオブジェクトはtime、開始年齢time2として、eventまたは発生したか発生しなかった年齢として使用して作成されます。これは賢明に聞こえるSurvかもしれませんが、のヘルプファイルでは、ここで実際に何が行われているのかは説明されていませんcounting。私はsurvivalマニュアルを見ましたそして、の参照としてcounting、Andersen&Gill 1982を指摘しました。これは私の頭の上に少しあり、左の切り捨てについて、または少なくともその名前では議論していないようです。特徴の1つは、「カウント」モデルが、個人が生涯に複数のイベントを保持できるケースに適合するように構築されているように見えることです。私の例ではそうではありませんが、おそらくそれは問題ではありません。 上記に基づいて、Coxの「カウント」モデルはデータセットAとBを比較する正しい方法であると思われ、Rでそのような比較を行うことができました(以下のコードを参照)。私はここで正しいことをしていますが、そのようなアプローチがデータセットAとCを比較するためにどのように(もしあれば)適用できるかわかりません。 最後に、私は、検索クロス検証済みのため切り捨てを左に生存し、人々は私が(求めているのと同様の質問をしていた事例が多数見つかった1、2、3、4、4、5、6、7)が、ほとんど未回答だったが、1つは上記のカインリファレンスを指し、もう1つはクライン&モエシュバーガー2003を指しました これは役に立ちました(egp 123とp。312を参照)。AとBはかなり単純なCoxアプローチを使用して比較できるという概念をサポートしているようですが、AとCの比較可能性や電力計算の質問には対応していません。 (ただし、統計的検定の質問に答えた場合、ブートストラップを行うことでおそらく能力を引き出すことができます)。 以下は、このシナリオを示すRの架空のデータです。各データセットに20行を含めましたが、重要なのは、私が想像している実際のシナリオでは、データセットAとBはおそらく50または100の患者のオーダーであり、データセットCは500または1,000人の患者。 # A) hypothetical data from …

2
Cox回帰とTobit回帰の関係は何ですか?
打ち切りデータを処理するために、Tobit回帰のような打ち切り回帰法を使用する研究者もいれば、Cox回帰のような古典的な生存分析モデルを使用する研究者もいます。 数学の観点から、Cox回帰とTobit回帰は2つの異なるモデルであることを知っています。 私の質問:これらの2つの方法の長所と短所は何ですか?彼らはそれぞれどのような問題を解決するのが得意ですか?それらは異なる仮定を持っていますか?

2
非比例ハザードに関する推奨事項
これは長い間悩まされてきた問題であり、教科書、Google、またはStack Exchangeで良い答えを見つけられませんでした。 4つの治療法が比較されている10万人を超える患者のデータセットがあります。研究の問題は、一連の臨床的/人口統計学的変数を調整した後、これらの治療の間で生存率が異なるかどうかです。未調整のKM曲線は次のとおりです。 非比例ハザードは、私が使用したすべての方法で示されました(たとえば、調整されていない対数-生存曲線、時間との相互作用、シェーンフィールド残差とランク付き生存時間の相関、これらは調整されたCox PHモデルに基づいています)。対数生存曲線は以下のとおりです。ご覧のとおり、非比例の形は混乱しています。2つのグループの比較はどれも、個別に処理するのが難しいほどのものではありませんが、6つの比較があるという事実は、本当に困惑しています。私の推測では、1つのモデルですべてを処理することはできません。 これらのデータをどうするかについての推奨事項を探しています。拡張されたCoxモデルを使用してこれらの効果をモデル化することは、非比例の比較と異なる形式の数を考えると、おそらく不可能です。彼らが治療の違いに興味を持っていることを考えると、全体的な層別モデルは、これらの違いを推定することができないため、選択肢にはなりません。 したがって、私を自由に引き離してください。しかし、最初に層別モデルを推定して、他の共変量の効果を得るために(もちろん、相互作用なしの仮定をテストして)、次に、それぞれについて個別の多変数Coxモデルを再推定することを考えていました。 2グループ比較(つまり、合計6モデル)。このようにして、2つのグループの比較ごとに非比例の形式に対処し、誤った推定HRを取得できます。標準誤差には偏りがあることは理解していますが、サンプルサイズを考えると、すべてが「統計的に」有意である可能性があります。

1
ビニングデータなしで生存データのキャリブレーションプロットを作成するにはどうすればよいですか?
Coxモデルから推定された生存確率のキャリブレーションプロットを作成するには、推定されたリスクをグループに分割し、グループ内の平均リスクを計算してから、これをカプランマイヤー推定と比較します。ビニングを必要としない代替アプローチは何ですか?そのようなテクニックを実装するために必要な具体的な手順は何ですか?その背後にあるロジックは何ですか?この質問にはいくつかの議論があります。

3
Rの時変共変量を使用したワイブル生存モデル
私はワイブルアプローチを使用して生存モデルを実行しようとしていますが、しわがあるのは、時変共変量があるためです。私はRでサバイバルパッケージを使用しています。私の呼び出しは次のとおりです。 output <- survreg(Surv(start, stop, fail) ~ gdppc + [...] + cluster(name), data = mydata, dist="weibull") 次のエラーが発生します。 Error in survreg(Surv(start, stop, fail) ~ gdppclag + : Invalid survival type coxph手順が正常に動作しますが、私はワイブルを使用します。 私の最初の質問は次のとおりです。ワイブルアプローチは、時変共変量を説明できますか?私はいくつかのテキストを見回しましたが、Cox PHアプローチは時変共変量に拡張できることがわかりました。ワイブルアプローチがそれを実行できるかどうかはあまり明確ではありません。 次に、実際にワイブルが機能する場合、それを処理できるRのパッケージは何ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.