カプラン・マイヤー曲線はコックス回帰とは別の言い方をしているようです


9

Rでは、がん患者の生存データ分析を行っています。

CrossValidatedやその他の場所での生存分析について非常に役立つ情報を読んでおり、Cox回帰の結果を解釈する方法を理解したと思います。しかし、1つの結果はまだ私を悩ませます...

生存率と性別を比較しています。カプラン・マイヤー曲線は明らかに女性患者に好意的です(私が追加した凡例が正しいことを何度か確認しました。最大生存期間4856日の患者は実際に女性です): ここに画像の説明を入力してください

そして、コックス回帰が戻ってきています:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

したがって、男性患者(gendermale)のハザード比(HR )は0.6903です。カプラン・マイヤー曲線を見ないで私がそれを解釈する方法は、次のとおりです。HRが1未満であるため、男性の性別の患者であることは保護的です。より正確には、女性患者は男性よりも特定の時間に死亡する可能性が1 / 0.6903 = exp(-coef)= 1.449です。

しかし、それはカプラン・マイヤー曲線が言うようには見えません!私の解釈の何が問題になっていますか?


3
KM曲線から、Cox回帰のPHの仮定は成り立たないようです。
ディープノース

そうですか。まだ調べたことはありません!グラフィカルに、それは私のカプラン・マイヤー曲線が平行であるべきであることを意味します、それで私はコックスを安全に使うことができますよね?だいたい2200日前なら大丈夫そうです。交差点の少し前にすべてのデータのCox結果を確認しても問題ありませんか?
francoiskroll 2017年

4
loglogS^i(t)S^i(t)i

@DeepNorth:私は比例ハザードに対する強力な証拠を実際には見ていません。ええ、曲線は技術的に重複しています...しかし、それは極端な尾部にあります。
Cliff AB

他の回答とコメントを補足するために、男性と女性の生存期間の中央値または5年生存期間を比較します。Cox PH分析と一致するこのデータには、男性にとって明らかな利点があります。
Itamar 2017年

回答:


12

これは、非比例ハザードまたは生存分析における「枯渇」の影響の非常に良い例です。説明しようと思います。

最初にカプラン・マイヤー(KM)曲線をよく見てください。最初の部分(約3000日まで)で、時間tで危険にさらされている母集団でまだ生存している男性の比率が女性の比率よりも大きいことがわかります。 (つまり、青い線は赤い線より「高い」)。これは、実際に男性の性別が、調査されたイベント(死)を「保護する」ことを意味します。したがって、ハザード比は0から1の間でなければなりません(係数は負でなければなりません)。

ただし、3000日を過ぎると、赤い線が高くなります。これは確かに反対を示唆しています。このKMグラフだけに基づいて、これは比例しない危険をさらに示唆します。この場合、「非比例」とは、独立変数(性別)の影響が時間とともに一定でないことを意味します。つまり、ハザードは時間の経過とともに変化する可能性があります。上記で説明したように、これは事実のようです。通常の比例ハザードCoxモデルは、このような影響に対応していません。実際、主要な前提の1つは、ハザードは比例しているということです。これで、実際には非比例ハザードもモデル化できますが、これはこの回答の範囲を超えています。

追加のコメントが1つあります。この違いは、実際のハザードが非比例またはKM曲線の裾の推定には多くの差異があるという事実。この時点で、合計348人の患者のグループは、依然として危険にさらされている非常に少数の人口に減少していることに注意してください。ご覧のとおり、どちらの性別グループにも、イベントを経験している患者と打ち切られている患者がいます(縦線)。危険にさらされている人口が減少するにつれ、生存推定値は不確かになります。KMラインの周りに95%の信頼区間をプロットした場合、信頼区間の幅が増加していることがわかります。これは、ハザードの推定にも重要です。簡単に言えば、研究の最終期間におけるリスクのある集団とイベントの量は少ないため、この期間は初期coxモデルの推定値にあまり貢献しません。

最後に、これはハザード(一定の時間をかけて想定される)が最終エンドポイントではなくKMの最初の部分により一致する理由を説明します。

編集:元の質問に対する@Scrotchiのスポットオンコメントを参照してください:述べたように、調査の最終期間における低い数値の影響は、それらの時点でのハザードの推定値が不確実であることです。その結果、比例ハザードの仮定の明らかな違反が偶然によるものではないかどうかについても確信が持てません。@ scrotchiの状態として、PHの仮定はそれほど悪くないかもしれません。


1
(-1)極端に端が交差し、データが非常に少なくなります。実際、「非比例ハザード」の証拠は2つの観察のみに基づいています(つまり、t> 2800の場合、女性コホートに残った被験者は2人だけでした。それ以外に、グループの前の最後のイベントはt = 2100)
Cliff AB

2
@CliffABフィードバックCliff ABをありがとう。あなたの発言がまさに私が言おうとしていたものなので、私は少し混乱しています。認めますが、少し短かったかもしれません。ただし、-1は少し厳しいです: '(
IWS

2
たぶん、それは私にとって少し卑劣だったのかもしれません。私の唯一のポイントは、これを見ると、必ずしも比例しないハザードの良い例ではなく、テールのデータがほとんどないということです。最初の文が修正されているのがわかりますが(最初にこれを逃したのでない限り、私はそう思いますか?)、対処しているので、(-1)は間違いなく要求されていません。
Cliff AB

1
おっと、初めて見逃したようです。ごめんなさい!
クリフAB

問題ありません、少なくとも私たちは回答に同意します:D
IWS

5

出力の性質について混乱しています。これらのデータは言う:あなたが男性の場合、あなたは女性よりも長生きする可能性が高いです。女性は男性よりも生存率が悪い。男性が女性よりもリスクが低いなど、男性であると負の対数ハザード比が得られるため、これは回帰出力に反映されます。ほとんどのイベント時には(曲線が「ステップ」になるとき)、男性の生存曲線が女性の生存曲線よりも大きく、Coxモデルの結果とグラフは非常によく一致しています。KM曲線は、回帰モデルの出力と同様にこれを確認します。「クロス」は取るに足らないものです。

KM曲線は、特にそれらが0%に近い場合、またはフラットにテーパーが付いている場合、尾部での動作が不十分です。Y軸は生存率です。研究に長く生き残った人は比較的少なく、その時に亡くなった人も少ないため、推定値の信頼性は直感的にもグラフ的にもひどいものです。私は、例えば、そこに目に見えて少なく、女性は男性よりも、あなたのコホートであり、注意して 2800日後、コホートに残っている10未満の女性は生存曲線と検閲イベントの欠如の手順によって証明されるように、そこにあること。

興味深いことに、KM曲線、ログランク検定、およびCoxモデルを使用した生存分析はランク付き生存時間を使用するため、実際の生存期間は多少関係ありません。あなたの最も長く生存している女性は、事実上、さらに100年生存している可能性があり、分析に影響を与えません。これは、ベースラインハザード関数(過去13年間イベントを観測していなかった)は、誰もそのとき亡くならなかったため、今後87年間は死亡のリスクがないと想定するためです。

堅牢なHRで正しい95%CIとp値を取得する場合robust=TRUEは、Cox-PH で指定してサンドイッチ標準誤差を取得します。その場合、HRはすべての失敗時に男性と女性を比較した時間平均HRです。


明確にするために:KMプロットでは、男性は約2700日まで生存率が向上しています。その後、女性はより良い生存をしています。しかし、そこにはデータがほとんどないため、そのテールは正確ではありません。KM曲線の2つのステップで女性の生存率が約35%から0%になることがわかります。そのため、おそらく2人です。信頼帯を使用してKM曲線をプロットすると役立ちます。それから私はあなたが約2000日まで明確な分離を見て、その後その後重なると思います。
Harvey Motulsky 2017年

2
@HarveyMotulsky trueですが、KMの末尾は非常に信頼できません。OPがCIを作成した場合、それらは強く重複します。そのため、推論的には、2,700日後の生存はおそらく曖昧であると言えます。
AdamO 2017年

まさに私のポイント。データは、男性(この状況では、それが何であれ)が少なくとも最初の2000日以上はより良い生存をしていることを明確に示しています。
Harvey Motulsky 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.