タグ付けされた質問 「cox-model」

コックス比例ハザード回帰は、生存分析のためのセミパラメトリック手法です。分布形を仮定する必要はありません。共変量の1単位の増加の効果が定数倍であることだけです。

3
Cox比例ハザードモデルから英語でハザード比を報告する方法は?
私の理解では、Cox比例ハザードモデルのハザード比は、与えられた因子のハザード率への影響を参照グループと比較するものです。統計を知らない聴衆にそれをどのように報告しますか? 例をフレーズしてみましょう。ソファを購入するまでの期間の調査に人々を登録するとします。3年で右検閲します。この例では、猫を飼っているかどうかにかかわらず、年齢<30または> = 30の2つの要因があります。参照グループ(30歳未満、「猫を飼っていない」)に対する「猫を飼っている」のハザード比は1.2であり、有意であることがわかりました(p <0.05)。 猫の飼い主は3年以内により多くのイベント(カウチ購入)を持っている、または猫の飼い主にとってイベントまでの時間(カウチ購入)が速い、またはこれら2つのことの組み合わせを意味していると言ってもいいですか? 編集:イベントが期間内にカウチを初めて購入した場合(発生した場合)。このモデルは、期間内の複数の購入の分析には役立ちません。

2
Rを使用したCoxモデルでベースラインハザード関数を推定する方法
時間依存のCoxモデルでベースラインハザード関数を推定する必要がありますλ0(t )λ0(t)\lambda_0(t) λ (t )= λ0(t )exp(Z(t )』β)λ(t)=λ0(t)exp⁡(Z(t)』β)\lambda(t) = \lambda_0(t) \exp(Z(t)'\beta) サバイバルコースを受講している間、累積ハザード関数()の直接導関数は、Breslow推定器がステップ関数を与えるため、良い推定器ではないことを覚えています。λ0(t )dt = dΛ0(t )λ0(t)dt=dΛ0(t)\lambda_0(t) dt = d\Lambda_0(t) では、Rに直接使用できる関数はありますか?またはこのトピックに関する参考資料はありますか? 別の質問を開く価値があるかどうかわからないので、ベースラインハザード関数が私にとって重要である理由をいくつか追加します。次の式は、ある被験者の生存時間が別の被験者よりも長い確率を推定します。Coxモデル設定では、ベースラインハザード関数が必要です。 λ0(t )λ0(t)\lambda_0(t) P(T1> T2)= - ∫∞0S1(t )dS2(T )= - ∫∞0S1(t )S2(t )λ2(t )dtP(T1>T2)=−∫0∞S1(t)dS2(t)=−∫0∞S1(t)S2(t)λ2(t)dtP(T_1 > T_2 ) = - \int_0^\infty S_1(t) dS_2(t) = - \int_0^\infty S_1(t)S_2(t)\lambda_2(t)dt
13 r  survival  cox-model 

1
GBMパッケージとGBMを使用したキャレット
私はを使用してモデルのチューニングを行ってきましたがcaret、gbmパッケージを使用してモデルを再実行しています。caretパッケージが使用gbmし、出力が同じである必要があることは私の理解です。ただし、を使用した簡単なテスト実行でdata(iris)は、評価指標としてRMSEとR ^ 2を使用したモデルで約5%の不一致が示されています。を使用して最適なモデルのパフォーマンスを見つけたいが、部分的な依存関係プロットを利用するためにcaret再実行しgbmます。再現性のために以下のコード。 私の質問は次のとおりです。 1)これらの2つのパッケージは同じであっても違いがあるのはなぜですか(確率的ですが、5%がやや大きな違いであることがわかります。特に、次のような素晴らしいデータセットを使用していない場合 iris、モデリングの) 。 2)両方のパッケージを使用する利点または欠点はありますか? 3)無関係:irisデータセットを使用した場合、最適な値interaction.depthは5ですが、読み取り値が最大値floor(sqrt(ncol(iris)))である2 を超えるはずです。これは厳密な経験則ですか、それとも非常に柔軟ですか。 library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) …

1
脆弱モデルから予測生存曲線を生成する方法(R coxphを使用)?
脆弱性の項を含むCox比例ハザードモデルの予測生存関数を計算したい[生存パッケージを使用]。脆弱性項がモデル内にある場合、予測された生存関数を計算できないようです。 ## Example require(survival) data(rats) ## Create fake weight set.seed(90989) rats$weight<-runif(nrow(rats),0.2,0.9) ## Cox model with gamma frailty on litter fit <- coxph(Surv(time, status) ~ rx+weight+frailty(litter,dist="gamma"), data = rats) ## Compute survival curve from the cox model for rx=0 and weight=0.5 kg plot(survfit(fit, newdata=data.frame(rx=0,weight=0.5)),xlab = "time", ylab="Survival") ## Running this line, …

2
正しい打ち切りでおもちゃの生存(イベントまでの時間)データを作成する方法
正しく打ち切られ、比例ハザードと一定のベースラインハザードのある分布に従うおもちゃの生存(イベントまでの時間)データを作成したいと思います。 次のようにデータを作成しましたが、Cox比例ハザードモデルをシミュレーションデータにフィッティングした後、真の値に近い推定ハザード比を取得できません。 私は何を間違えましたか? Rコード: library(survival) #set parameters set.seed(1234) n = 40000 #sample size #functional relationship lambda=0.000020 #constant baseline hazard 2 per 100000 per 1 unit time b_haz <-function(t) #baseline hazard { lambda #constant hazard wrt time } x = cbind(hba1c=rnorm(n,2,.5)-2,age=rnorm(n,40,5)-40,duration=rnorm(n,10,2)-10) B = c(1.1,1.2,1.3) # hazard ratios (model coefficients) hist(x %*% …

1
フィッシャーの厳密検定と超幾何分布
私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。 > soda_gender f m n 0 5 y 5 0 明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。 Rでフィッシャーの正確検定を実行すると、次の結果が得られます。 > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。 フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。 。この観察の可能性は何ですか?この質問に答えるために、次のコマンドを使用しました。 …

1
シェーンフェルト残差
多くの変数を含むCox比例ハザードモデルで、シェーンフェルト残差が変数の1つに対して平坦でない場合、これはモデル全体を無効にするか、またはパフォーマンスの低い変数だけを無視できますか?つまり、他の変数の係数を解釈しますが、パフォーマンスの低い変数の結果の係数は解釈しません。 シェーンフェルト残差が平坦でないモデルを処理するには、いくつかの標準的な方法があります。今のところ、それができないと仮定します。

2
Cox PHモデルから予測ハザード率を計算する方法は?
次のCox PHモデルがあります。 (時間、イベント)〜X + Y + Z 私は予測ハザード取得したいと思い金利(私はハザード率について話していないで、特定の値が与えられ、ハザード比)をX、Y、Z。muhaz Rパッケージが観測されたハザード率を計算できることは知っていますが、予測モデルに興味があります。 Rでこれを行う方法はありますか?
11 r  survival  hazard  cox-model 

4
病院ベースのRCTでの滞在期間データの分析に最適な方法は?
RCTからの入院期間(LOS)データを分析する最適な方法についてコンセンサスがあるかどうか知りたいです。これは通常、非常に右に歪んだ分布であり、ほとんどの患者は数日から1週間以内に退院しますが、残りの患者は非常に予測できない(時にはかなり長い)滞在をしていて、分布の右端を形成します。 分析のオプションは次のとおりです。 t検定(存在しない可能性が高い正常性を想定) マンホイットニーUテスト ログランク検定 グループ割り当てに関する条件付きCox比例ハザードモデル これらの方法のどれかが明らかに高い力を持っていますか?

1
CPH、加速故障時間モデル、または生存分析のためのニューラルネットワークの比較
私は生存分析が初めてですが、特定の目標を前提としてそれを行うにはさまざまな方法があることを最近知りました。これらの方法の実際の実装と妥当性に興味があります。 時間、ステータス、その他の医療データを考慮して患者の生存率を上げる方法として、従来のCox比例ハザード、加速故障時間モデル、ニューラルネットワーク(多層パーセプトロン)が提示されました。研究は5年で決定されると言われ、目標は新しい記録が与えられるために毎年生存リスクを与えることです。 Cox PHで他の方法が選択された2つのインスタンスが見つかりました。 「Cox PHモデルから生存時間に関する予測を取得する方法」が見つかり、次のように述べられました。 特定の時点での生存確率の推定値に特に関心がある場合は、パラメトリック生存モデル(別名、加速故障時間モデル)を紹介します。これらは、Rの生存パッケージに実装されており、パラメトリックな生存時間分布を提供します。ここで、関心のある時間をプラグインするだけで、生存確率を取得できます。 私は推奨サイトに行って、survivalパッケージの 1つ-関数を見つけましたsurvreg。 このコメントでニューラルネットワークが提案されました: ...生存分析へのニューラルネットアプローチの1つの利点は、Cox分析の根底にある仮定に依存しないことです... 「生存予測を含む出力としてターゲットベクトルを使用したRニューラルネットワークモデル」という質問を持つ別の人は、ニューラルネットワークとCox PHの両方で生存を決定する包括的な方法を示しました。 サバイバルを取得するためのRコードは次のようになります。 mymodel <- neuralnet(T1+T2+T3+T4+T5~covar1+covar2+covar3+..., data=mydata, hidden=1) compute(mymodel,data=mydata) 私はRフォーラムに行って、この回答を質問「predict.coxphとpredict.survreg」で見つけました。 実際、のpredict()関数からcoxph直接「時間」予測を取得することはできず、線形で指数的なリスクスコアのみを取得できます。これは、時間を取得するためにベースラインハザードを計算する必要があり、Coxモデルでは暗黙的であるため簡単ではないためです。 興味のある期間の生存率を得るのに、3つ(またはCox PHに関する議論を考慮した2つ)が最適かどうか疑問に思っていましたか?どちらを生存分析に使用するか混乱しています。

2
Cox PH分析および共変量選択における傾向スコアの重み付け
イベント発生までの時間の生存データのコックス比例ハザードモデリングを行う際の傾向スコアの重み付け(IPTW)について: 私は、ほとんどの場合、患者がベースラインですでに服用していた薬剤の治療効果を調べることに関心がある、予想されるレジストリデータを持っています。したがって、データを最適に分析する方法がわかりません。潜在的に、いくつかのベースライン変数はかなりの程度、治療によって影響され、その逆ではありません(たとえば、特定のバイオマーカー)。重みを推定するための傾向スコアモデルに含める必要がある共変量と、coxphモデルに共変量として含める必要がある共変量(ある場合)について少し迷っています。正しい方向のヒントがあれば役立ちます。現在のところ、CoxPhモデリングでこれに関する文献を見つけることはできません。 ベースラインで開始され、結果に影響を与える可能性のある治療を表す共変量は、Cox PH共変量として含める必要があると考えていますが、これはわかりません。 傾向スコアの重みの計算に使用するのではなく、Coxモデルに共変量として含める必要がある変数をどのように決定しますか? フォローアップの質問: 私は、すでに始まっている特定の介入の治療効果を評価するという相続問題を理解しています。つまり、観察を始める前に、患者に蔓延しています。リスクの時間変動に関連するバイアスの導入(たとえば、治療の最初の年に一般的な有害な副作用)と治療によって影響を受ける共変量の両方について。私が間違っていない場合-これは、心血管エンドポイントとホルモン補充療法に関して、観察と無作為化の間の不一致の原因として提案されています。一方、私のデータセットでは、治療の悪影響の可能性を調べることに関心があります。 傾向スコア調整を使用して、一般的なユーザー間の治療効果を調査する場合、つまり、観察が始まる前にすでに薬物を使用しているコホートデータで、薬物療法の悪影響を観察した場合(これは私たちが探していたものです)。治療に伴うリスクを過大評価する可能性を排除できますか?つまり、リスクが大幅に上昇している限り、それは最も「確実に」防御的ではありませんか? この種のバイアスが、この文脈での偽のリスク関連のリスクの過大評価をもたらす可能性がある例を完全に描くことはできません。

2
Rのcoxph()は繰り返し測定をどのように処理しますか?
環境 Rのcoxph()が被験者(または患者/顧客)の繰り返しエントリをどのように受け入れて処理するかを理解しようとしています。これをロングフォーマットと呼ぶ人もいれば、「反復測定」と呼ぶ人もいます。 たとえば、次のAnswersセクションのID列を含むデータセットを参照してください。 時変共変量を含むCoxモデルに最適なパッケージ また、共変量は全体にわたって時変であり、バイナリである検閲(つまりイベント)変数が1つだけあると仮定します。 ご質問 1)上記のリンクの回答で、coxph()の呼び出しでパラメーターとしてIDが指定されていない場合、結果はcoxph()のパラメーターとしてcluster(ID)を含めるのと同じですか? ドキュメントを検索しようとしましたが、(1)に明確に対処していないようです:https : //stat.ethz.ch/pipermail/r-help//2013-July/357466.html 2)(1)の答えが「いいえ」の場合、(数学的に)なぜですか?coxph()のcluster()は、pgのサブセクション 'cluster'に従って被験者間の相関を求めているようです。20時 https://cran.r-project.org/web/packages/survival/survival.pdf 3)あいまいな質問:反復測定のあるcoxph()は、Rのfrailtypack回帰法とどのように比較されますか? 補遺 cluster(ID)の使用に関する以下のヒント: ログランクテストの繰り返し測定対応バージョンはありますか? 同様に: https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html GEEアプローチ:coxphのモデルステートメントに「+ cluster(subject)」を追加混合モデルアプローチ:coxmeのモデルステートメントに「+(1 | subject)」を追加します。 前もって感謝します!

2
オッズ比とハザード比の間に機能的な違いはありますか?
ロジスティック回帰では、オッズ比2は、予測子が1ユニット増加した場合に、イベントの確率が2倍高いことを意味します。Cox回帰では、ハザード比2は、予測子が1ユニット増加すると、各時点でイベントが2倍の頻度で発生することを意味します。これらは実質的に同じものではありませんか? ロジスティック回帰のオッズ比から機能的に同じ情報を取得できる場合、Cox回帰を行ってハザード比を取得する利点は何でしょうか。

1
R線形回帰のカテゴリ変数「非表示」の値
これは私が何度か遭遇した例にすぎないため、サンプルデータはありません。Rで線形回帰モデルを実行する: a.lm = lm(Y ~ x1 + x2) x1は連続変数です。x2カテゴリ型で、「低」、「中」、「高」の3つの値があります。ただし、Rによって与えられる出力は次のようになります。 summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 私は、Rがそのような要因(要因x2であること)に何らかのダミーコーディングを導入していることを理解しています。私はただ疑問に思っていx2ます。「高」の値をどのように解釈しますか?たとえば、ここで示した例の「High」x2は応答変数にどのような影響を与えますか? これの例を他の場所(例:ここ)で見ましたが、理解できる説明は見つかりませんでした。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
カプラン・マイヤー曲線はコックス回帰とは別の言い方をしているようです
Rでは、がん患者の生存データ分析を行っています。 CrossValidatedやその他の場所での生存分析について非常に役立つ情報を読んでおり、Cox回帰の結果を解釈する方法を理解したと思います。しかし、1つの結果はまだ私を悩ませます... 生存率と性別を比較しています。カプラン・マイヤー曲線は明らかに女性患者に好意的です(私が追加した凡例が正しいことを何度か確認しました。最大生存期間4856日の患者は実際に女性です): そして、コックス回帰が戻ってきています: Call: coxph(formula = survival ~ gender, data = Clinical) n= 348, number of events= 154 coef exp(coef) se(coef) z Pr(>|z|) gendermale -0.3707 0.6903 0.1758 -2.109 0.035 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 exp(coef) exp(-coef) lower .95 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.