タグ付けされた質問 「cox-model」

コックス比例ハザード回帰は、生存分析のためのセミパラメトリック手法です。分布形を仮定する必要はありません。共変量の1単位の増加の効果が定数倍であることだけです。

5
コックス回帰の予測
多変量Cox回帰を行っています。重要な独立変数とベータ値があります。モデルは私のデータに非常によく適合しています。 次に、モデルを使用して、新しい観測の生存を予測したいと思います。Coxモデルを使用してこれを行う方法は不明です。線形回帰またはロジスティック回帰では、新しい観測の値を回帰に入れ、それらにベータを掛けるだけで簡単になり、結果を予測できます。 ベースラインの危険性を判断するにはどうすればよいですか?予測の計算に加えて、それが必要です。 これはCoxモデルでどのように行われますか?


2
生存分析において、なぜ完全なパラメトリックモデルの代わりにセミパラメトリックモデル(Cox比例ハザード)を使用するのですか?
この質問は、相互検証で回答できるため、Mathematics Stack Exchangeから移行されました。 6年前に移行され ました。 Cox Proportional Hazardsモデルを研究してきましたが、この質問はほとんどのテキストで取り上げられています。 コックスは、部分尤度法を使用してハザード関数の係数を適合させることを提案しましたが、最大尤度法と線形モデルを使用してパラメトリック生存関数の係数を適合させるだけではどうですか? データを打ち切った場合は、曲線の下の領域を見つけることができます。たとえば、推定値が80の標準偏差で380であり、サンプルが300以上を打ち切られている場合、正規誤差を仮定した尤度計算でそのサンプルの確率は84%です。

1
Coxベースラインハザード
「腎臓カテーテル」データセットがあるとしましょう。Coxモデルを使用して生存曲線をモデル化しようとしています。Coxモデルを考えると:ベースラインハザードの推定値が必要です。組み込みのパッケージR関数を使用することで、次のように簡単に実行できます。h (t 、Z)= h0exp(b′Z)、h(t,Z)=h0exp⁡(b′Z)、h(t,Z) = h_0 \exp(b'Z),survivalbasehaz() library(survival) data(kidney) fit <- coxph(Surv(time, status) ~ age , kidney) basehaz(fit) しかし、パラメータの特定の推定値のベースラインハザードのステップごとの関数を書きたい場合はどうすればよいbですか?私は試した: bhaz <- function(beta, time, status, x) { data <- data.frame(time,status,x) data <- data[order(data$time), ] dt <- data$time k <- length(dt) risk <- exp(data.matrix(data[,-c(1:2)]) %*% beta) h <- rep(0,k) for(i in 1:k) …
19 r  cox-model  hazard 

2
のcoxphモデルの要約で与えられた「
のcoxphモデルの要約で与えられるR 2値は何ですか?例えば、R2R2R^2 Rsquare= 0.186 (max possible= 0.991 ) 私は愚かにも原稿を値として含めましたが、レビュアー はCoxモデル用に開発された古典的な線形回帰からのR 2統計の類似体に気づいていないと言いました。参照。どんな助けも素晴らしいでしょう!R2R2R^2R2R2R^2

1
predict.coxphの出力を解釈する方法は?
coxmodelを近似した後、予測を行い、新しいデータの相対的なリスクを取得することができます。私が理解していないのは、個人の相対リスクがどのように計算され、それが何に関連するのか(つまり、人口の平均)ですか?理解を助けるためのリソースに関する推奨事項(サバイバル分析はあまり進歩していないので、単純であるほど良いですか?)

1
Cox比例ハザードモデルのロジスティック回帰よりもp値が高いことが多いのはなぜですか?
コックス比例ハザードモデルについて学んでいます。私は、ロジスティック回帰モデルを当てはめる多くの経験を持っており、そのビルド直感に私がモデルを比較してきた使用してフィットcoxphロジスティック回帰モデルを使用してフィットとR「生存」からglmとfamily="binomial"。 コードを実行した場合: library(survival) s = Surv(time=lung$time, event=lung$status - 1) summary(coxph(s ~ age, data=lung)) summary(glm(status-1 ~ age, data=lung, family="binomial")) 年齢がそれぞれ0.0419と0.0254のp値を取得します。同様に、年齢を問わず性別を予測因子として使用する場合。 モデルをフィッティングする際に経過時間を考慮すると、単に死亡をバイナリの結果として扱うよりも統計的な力が得られるのに対し、p値は統計的な力の低い人と一致すると思われるため、この不可解なことに気付きます。ここで何が起こっていますか?

3
Rの時間依存係数-実行方法
更新:別の更新で申し訳ありませんが、分数多項式と競合するリスクパッケージを使用したいくつかの可能な解決策を見つけました。 問題 私はRにある時間依存係数分析を行う簡単な方法を見つけることができません。変数係数を取り、それを時間依存係数(変数ではない)に入れてから、時間に対する変動をプロットしたいです: βmy_variable=β0+β1∗t+β2∗t2...βmy_variable=β0+β1∗t+β2∗t2...\beta_{my\_variable}=\beta_0+\beta_1*t+\beta_2*t^2... 可能な解決策 1)データセットの分割 この例(ラボセッションのパート2)を見てきましたが、別のデータセットの作成は複雑で、計算コストがかかり、あまり直感的ではないようです... 2)ランクの低いモデル-coxvcパッケージ coxvcパッケージには、問題に対処するためのエレガントな方法を提供します-ここだマニュアル。問題は、作成者がパッケージを開発していないことです(最後のバージョンは2007年5月23日以降です)。電子メールでの会話の後、パッケージが機能するようになりましたが、データセットで1回の実行に5時間かかりました(140 000エントリ)、期間の終わりに極端な推定値を提供します。ここで少し更新されたパッケージを見つけることができます-私はほとんどプロット関数を更新しました。 それは単に微調整の問題かもしれませんが、ソフトウェアは信頼区間を簡単に提供できず、プロセスは非常に時間がかかるため、他のソリューションを今見ています。 3)timeregパッケージ 印象的なtimeregパッケージもこの問題に対処していますが、その使用方法は定かではなく、スムーズなプロットが得られません。 4)分数多項式時間(FPT)モデル アニカ・ブッフホルツは、「治療と予後因子の経時変化の長期的影響の評価」に関する優れた論文を見つけました。彼女は、Sauerbreiらの提案したFPTが時間依存係数に最も適切であると結論付けています。 FPTは時変効果の検出に非常に優れていますが、ランクの削減アプローチでは時変効果の選択が含まれないため、モデルが非常に複雑になります。 研究は非常に完了しているように見えますが、私には少し手の届かないところにあります。彼女はたまたまザウアーブレイと仕事をしているので、私も少し不思議に思っています。それは健全に思えますが、mfpパッケージを使用して分析を行うことができると思いますが、どうすればよいかわかりません。 5)cmprskパッケージ 私は競合するリスク分析を行うことを考えてきましたが、計算には時間がかかるため、通常のcox回帰に切り替えました。CRRは、時間依存の共変量のオプションをthougあります。 .... cov2 matrix of covariates that will be multiplied by functions of time; if used, often these covariates would also appear in cov1 to give a prop hazards effect plus a …

3
コックスモデルとロジスティック回帰
次の問題が発生したとします。 今後3か月以内に当店で購入を停止する可能性が最も高いクライアントを予測します。 各クライアントについて、ショップで購入を開始した月がわかります。さらに、月次集計で多くの行動機能があります。「最年長」のクライアントは50か月間購入しています。クライアントが購入を開始してからの時間を()で示しましょう。クライアントの数は非常に多いと想定できます。クライアントが3か月間の購入を停止してから戻ってきた場合、その顧客は新しい顧客として扱われるため、イベント(購入の停止)は1回しか発生しません。Tの∈ [ 0 、50 ]tttt∈[0,50]t∈[0,50]t \in [0, 50] 2つの解決策が思い浮かびます。 ロジスティック回帰 -各クライアントおよび各月(最新の3か月を除く)で、クライアントが購入を停止したかどうかを判断できるため、クライアントと月ごとに1回の観測でローリングサンプルを実行できます。カテゴリ変数として開始してからの月数を使用して、基本ハザード関数に相当するものを取得できます。 拡張Coxモデル -この問題は、拡張Coxモデルを使用してモデル化することもできます。この問題は生存分析により適しているようです。 質問:同様の問題における生存分析の利点は何ですか?生存分析は何らかの理由で発明されたため、何らかの重大な利点がなければなりません。 生存分析に関する私の知識はそれほど深くはなく、Coxモデルの潜在的な利点のほとんどは、ロジスティック回帰を使用しても達成できると思います。 層化コックスモデルの等価物は、と層化変数の相互作用を使用して取得できます。 ttt 相互作用コックスモデルは、母集団をいくつかの部分母集団に分割し、すべての部分母集団のLRを推定することで取得できます。 私が見る唯一の利点は、Coxモデルがより柔軟であることです。たとえば、クライアントが6か月後に購入を停止する確率を簡単に計算できます。

3
シェーンフェルト残差が良くない場合の比例ハザード回帰モデルのオプションは何ですか?
を使用してRでCox比例ハザード回帰を実行していcoxphます。これには多くの変数が含まれています。マーチンゲール残差は見栄えが良く、シェーンフェルト残差はすべての変数のALMOSTに最適です。シェーンフェルトの残差が平坦でない3つの変数があり、変数の性質は、時間とともに変化することが理にかなっています。 これらは私があまり興味を持たない変数なので、階層にすると良いでしょう。ただし、それらはすべて連続変数であり、カテゴリ変数ではありません。そのため、私は地層が実行可能なルートではないと認識しています*。ここで説明したように、変数と時間の相互作用を構築しようとしましたが、エラーが発生します。 In fitter(X, Y, strats, offset, init, control, weights = weights, : Ran out of iterations and did not converge 私はほぼ1000個のデータポイントで作業しており、それぞれ多くの要因を持つ6個の変数で作業しているので、このデータをスライスしてさいの目に切る方法の限界を押し上げているように感じます。残念ながら、含まれる変数を減らして試したより単純なモデルはすべて明らかに悪化しています(例:シェーンフェルトの残差は、変数が増えるとより汚れやすくなります)。 私のオプションは何ですか?私はこれらの特定の不適切な動作の変数を気にしないので、それらの出力を単に無視したいのですが、それは有効な解釈ではないと思います! * 1つは連続、1つは100を超える範囲の整数、1つは6の範囲の整数です。おそらくビニングですか?

3
Cox PHモデルから生存時間に関する予測を取得する方法は?
フォローアップの終わり(例:1年)で(ほぼ)全員が死亡した参加者のデータセットにおける全原因死亡率の予測モデル(Cox PH)を開発したい。 特定の時点で死亡する絶対的なリスクを予測する代わりに、各個人の生存期間(月単位)を予測したいと思います。 Rでそのような予測を取得することは可能ですか(たとえばcoxphオブジェクトから)、はいの場合、どうすればそれを行うことができますか? 事前に感謝します!

3
機械学習モデル(GBM、NNなど)を生存分析に使用するにはどうすればよいですか?
Cox Proportional Hazards回帰やいくつかのKaplan-Meierモデルなどの従来の統計モデルを使用して、障害などのイベントの次の発生までの日数を予測できることを知っています。つまり、生存分析 ご質問 GBMやニューラルネットワークなどの機械学習モデルの回帰バージョンを使用して、イベントが発生するまでの日数を予測するにはどうすればよいですか? 発生までの日数をターゲット変数として使用し、単に回帰モデルを実行するだけでは機能しないと思いますか?なぜ機能しないのか、どうすれば修正できますか? 生存分析問題を分類に変換してから、生存確率を取得できますか?その後、バイナリターゲット変数を作成する方法は? 機械学習アプローチとコックス比例ハザード回帰およびカプラン・マイヤーモデルなどの長所と短所は何ですか? サンプル入力データが以下の形式であることを想像してください 注意: センサーは10分間隔でデータをpingしますが、NAの行で表されるように、ネットワークの問題などによりデータが欠落する場合があります。 var1、var2、var3は予測変数、説明変数です。 failure_flagは、マシンが失敗したかどうかを示します。 マシンIDごとに10分間隔で6か月分のデータがあります 編集: 予想される出力予測は以下の形式である必要があります 注:毎日のレベルで、今後30日間の各マシンの障害の可能性を予測します。

2
生存分析における打ち切りのレイマンの説明
私は検閲とは何か、そして生存分析でどのように検閲する必要があるかについて読んだことがありますが、数学的定義のより少ない定義とより直感的な定義を聞きたいです(写真は素晴らしいでしょう!)誰でも1)検閲と2)カプラン・マイヤー曲線やCox回帰のようなものにどのように影響するかの説明を提供できますか?

1
層および層と共変量の相互作用を持つCoxモデルの適合は、2つのCoxモデルの適合とは異なりますか?
回帰モデリング戦略ハレル(第2版)によってセクション(S. 20.1.7)主効果生存に対する我々は(以下の例では年齢)も推定する共変量の間の相互作用を含むコックスモデルを検討し、あります主効果を推定したくない共変量(下の例では性別)。 具体的には、母集団では(未知、真)ハザードh(t)h(t)h(t)がモデルに従うと仮定します h(t)={hf(t)exp(β1age),hm(t)exp((β1+β2)age),for female patiensfor male patiensh(t)={hf(t)exp⁡(β1age),for female patienshm(t)exp⁡((β1+β2)age),for male patiensh(t) = \begin{cases} h_f(t) \exp(\beta_1 \textrm{age}), & \textrm{for female patiens} \\ h_m(t) \exp((\beta_1 + \beta_2) \textrm{age}), & \textrm{for male patiens} \end{cases} hfhfh_f、hmhmh_m未知です、真の、ベースラインハザード関数と推定されるべきではなくβ1β1\beta_1、β2β2\beta_2 未知の、データから推定される真のパラメーターです。 (この例はほとんど文字通り本から取られています。) ハレルは、上記の状況を成層コックスモデルモデル1として書き直すことができると述べています。 h(t)=hgender(t)exp(β1age+β2X)h(t)=hgender(t)exp⁡(β1age+β2X)h(t) = h_{\textrm{gender}}(t) \exp(\beta_1 \textrm{age} + \beta_2 X) '対話用語'XXX男性女性、年齢はゼロに等しいです。それは我々が推定するための標準的な技術を使用できることを意味しますので、これは便利ですβ1β1\beta_1およびβ2β2\beta_2。 さて、質問です。2人の研究者AとBに、上記の母集団から抽出された患者の同じサンプルが与えられたとします。研究員Aフィットモデル1、取得推定値はβ 1、β 2β^1β^1\hat{\beta}_1β^2β^2\hat{\beta}_2、真のパラメータがためにβ1,β2β1,β2\beta_1, \beta_2信頼区間と一緒に。 研究者Bは、二つの通常の(すなわちunstratisfied)コックス・モデルをフィッティングのより単純なアプローチをとる:モデルA: …

2
単純な英語のRを使用したCox比例ハザード回帰モデルの解釈と検証
誰かが私のCoxモデルをわかりやすい英語で説明できますか? 関数を使用して、すべてのデータに次のCox回帰モデルを適合させましたcph。データはと呼ばれるオブジェクトに保存されますData。変数w、xとy連続しています。z2つのレベルの要因です。時間は月単位で測定されます。私の患者の中には、変数のデータが欠落しているものもありますz(注意:私は、モデルにバイアスをかけないようにこれらの値を調整するというハレル博士の提案を以下に正式に指摘しました。今後もそうします)。 > fit <- cph(formula = Surv(time, event) ~ w + x + y + z, data = Data, x = T, y = T, surv = T, time.inc = 12) Cox Proportional Hazards Model Frequencies of Missing Values Due to Each Variable Surv(time, event) w x y z …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.