Rのcoxphの「coef」と「（exp）coef」の出力の違いは何ですか？

14

私は、coxphの「coef」および「（exp）coef」出力が正確に何を意味するかを見極めようとしています。「（exp）coef」は、コマンドで割り当てられたグループに応じたモデルの最初の変数の比較であるようです。

coxph関数は、「coef」および「（exp）coef」の値にどのように到達しますか？

さらに、打ち切りが含まれる場合、coxphはこれらの値をどのように決定しますか？

r survival interpretation

21

治療グループなどの単一の説明変数がある場合、Coxの回帰モデルにはcoxph(); が適合します。係数（coef）は、回帰係数（以下で説明するCoxモデルのコンテキスト）として読み取られ、その指数関数は、治療グループ（対照グループまたはプラセボグループと比較して）の危険性を示します。例えば、、次いで、危険である、16.5％です。 $\hat\beta=-1.80$ $\exp(-1.80)=0.165$

ご存知かもしれませんが、ハザード関数は次のようにモデル化されます

h (t) = h_{0} (t) \exp (β^{'} x)

$h(t)=h_0(t)\exp(\beta'x)$

ここで、はベースラインハザードです。ハザードは、共変量に乗算依存し、の値の二人の個人の間の危険の比である、他のすべての共変量が一定に保持されているときに一個の単位だけ異なります。任意の2人の個人とのハザードの比率は $h_0(t)$ $\exp(\beta_1)$ $x_1$ $i$ $j$ $\exp\big(\beta'(x_i-x_j)\big)$ 、ハザード比（または発生率比）と呼ばれます。この比率は時間とともに一定であると想定されるため、比例ハザードと呼ばれます。

についての前の質問をエコーするためにsurvreg、ここでは形式は指定されていません。より正確には、これは共変量の効果のみがパラメーター化され、ハザード関数ではないという点で、セミパラメトリックモデルです。言い換えれば、生存時間に関する分布の仮定を行いません。 $h_0(t)$

回帰パラメーターは、以下によって定義される部分対数尤度を最大化することにより推定されます。

ℓ = \sum_{f} \log (\frac{\exp (β^{'} x_{f})}{\sum_{r (f)} \exp (β^{'} x_{r})})

$\ell=\sum_f\log\left(\frac{\exp(\beta'x_f)}{\sum_{r(f)}\exp(\beta'x_r)}\right)$

$f$ $r(f)$ $\ell$ $\beta$ $h_0(t)$ $h_0(t)$ $\beta$ $h_0(t)$ $\beta$

打ち切りについては、左打ち切り（遅延エントリとも呼ばれる、観測が開始された時間よりも早い時間スケールの起源を考慮する場合のように）または右打ち切りを参照するかどうかは明確ではありません。いずれにせよ、回帰係数の計算とサバイバルパッケージが打ち切りを処理する方法の詳細については、Therneau and Grambsch、Modeling Survival Data（Springer、2000）を参照してください。Terry Therneauは、以前のSパッケージの作成者です。オンラインチュートリアルが利用可能です。

$\chi^2$

— chl
ソース

4

+1、これは非常に単純でわかりやすい質問に対する非常に有益な回答です。詳細については、リソースへのリンクに特に感謝しています。NBテリーテルノーのオンラインチュートリアルへのリンクは無効です。Sでの生存分析のパッケージは、同じ素材へのライブリンクである場合があります。

— GUNG -復活モニカ

5

Rで次のように入力して取得したcoxphオブジェクトのprintメソッドのドキュメントを引用するには?survival::print.coxph：

coefficients モデル行列の列を乗算する線形予測子の係数。

これが、パッケージの作成者が提供するすべてのドキュメントです。パッケージには、ユーザーガイドまたはパッケージビネットは含まれていません。Rは使いやすいように設計されておらず、関連する統計的手法をすでに理解していることを前提としています。

coef列は上記を与えcoefficients、exp(coef)列はこれらの指数関数であると仮定します。Cox回帰には対数リンク関数が含まれるため、係数は対数ハザード比です。したがって、それらを指数化すると、ハザード比が得られます。

— ワンストップ
ソース