コックス比例ハザードモデルと、より大きなケースの相互作用が含まれる場合の係数の解釈


9

以下は、私が使用したCoxphモデルの要約出力です(Rを使用し、出力は最良の最終モデルに基づいています。つまり、すべての重要な説明変数とそれらの相互作用が含まれています)。

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

質問は:

この場合、係数とexp(coef)の値は非常に大きな値なので、どのように解釈するのですか?また、3ケースの相互作用が含まれているため、解釈がさらに混乱します。

私がこれまでオンラインで見つけたCoxphモデルに関するすべての例は、相互作用の項(常に重要ではないことが判明)と係数値(=ハザード率)およびこれらの指数(=ハザード比)に関して非常に単純でした。非常に小さく、「扱いやすい」数値。たとえば、係数= 1.73-> exp(coef)= 5.64。しかし、私の要約出力(上記)からわかるように、私のものははるかに大きな数です。そして、それらは非常に大きな値であるため、ほとんど意味をなさないようです。

相互作用が1単位(?)増えると、生存率はたとえば8.815e + 34(相互作用のハザード比LT:Food:Temp2)倍低いと考えるのは少しばかげているようです。

実際、この3つのケースの相互作用を解釈する方法もわかりません。相互作用のすべての変数が1単位増えると、生存率が特定の量(exp(coef)-valueで示される)だけ減少するということですか?

誰かが私をここで手助けしてくれるなら素晴らしいです。:)

以下は、コックス分析に使用したデータシートの一部です。ここで、いくつかの「時間、ステータス応答変数」に同じ説明変数値(つまり、LT、Food、Temp2)を何度も使用したことがわかります。これらの説明変数の値はすでにこれらの変数の平均値です(実際にはフィールドワークが設定されているため、観測された各応答個人の個別の説明変数値を取得できなかったため、このフェーズですでに使用されている平均値)、これは提案1(?)に回答します(最初の回答を参照)。

提案2(最初の回答を参照):私はRを使用していますが、Rにはまだ超神ではありません。:)したがって、関数predict(cox.model、type = "expected")を使用すると、膨大な量の異なる値が得られ、それらがどの説明変数をどの順序で参照しているかの手がかりがありません。または、予測関数で特定の交互作用項を強調表示することは可能ですか?ここで自分をはっきりさせているかどうかはわかりません。

提案3(最初の回答を参照):以下のデータシートの一部で、さまざまな説明変数の単位を確認できます。それらはすべて異なり、小数点を含みます。これはcoxの結果と関係がありますか?

データシートの一部:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

乾杯、ウンナ


@MansT:素敵な質問を編集しました;-)
ocram

回答:


7

CoxPHに直接関連するのではなく、相互作用と共線性に関連するいくつかの提案

1)このような「クレイジーな」値を取得する場合、1つの可能性は共線性です。これは、相互作用があるときに問題になることがよくあります。すべての変数を中央揃えしましたか(それぞれから平均を差し引くことによって)?

2)多くの1つの相互作用を非常に簡単に解釈することはできません。LT、food、temp2はすべて、多くの相互作用に関与しています。したがって、さまざまな組み合わせからの予測値を見てください。

3)さまざまな変数の単位を確認します。クレイジーなパラメーターを取得するとき、時々それは単位の問題です(例えば、ミリメートルまたはキロメートルでの人間の高さの測定)

4)それを整理したら、さまざまな相互作用(特に高レベルの相互作用)の影響を考える最も簡単な方法は、独立した値のさまざまな組み合わせで予測値をグラフ化することです。


以下のヘイは、cox分析に使用したデータシートの一部です。ここで、いくつかのTime、Status応答変数に同じ説明変数値(つまり、LT、Food、Temp2)を何度も使用したことがわかります。これらの説明変数の値はすでにこれらの変数の平均値です(実際にはフィールドワークが設定されているため、観測された各応答個人の個別の説明変数値を取得できなかったため、このフェーズですでに使用されている平均値)、これは提案1(?)に答えます。
Unna

提案2:私はRを使用していますが、Rにはまだ超神ではありません。:)したがって、関数predict(cox.model、type = "expected")を使用すると、膨大な量の異なる値が得られ、それらがどの説明変数をどの順序で参照しているかの手がかりがありません。または、予測関数で特定の交互作用項を強調表示することは可能ですか?ここで自分をはっきりさせているかどうかはわかりません。
Unna

提案3:以下のデータシートの部分で、さまざまな説明変数の単位を見ることができます。それらはすべて異なり、小数点を含みます。これはcoxの結果と関係がありますか?
Unna

時間(日)ステータスLT(h)食品(1日あたりの部分)Temp2(ºC)28 0 14.42 4.46 3.049 22 0 14.42 4.46 3.049 9 1 14.42 4.46 3.049 24 0 15.33 4.45 2.595 24 0 15.33 4.45 2.595 19 1 15.33 4.45 2.595
Unna

私が使用したデータシートの例についての上記のコメントは、表の形では示されていませんが、それから理解できることを望んでいます。:)
Unna
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.