データの構造と時間依存変数を含む繰り返しイベントデータの関数呼び出し


9

患者の転倒の可能性()に対する2つの薬剤(drug1drug2)の効果を推定しようとしていeventます。患者は複数回転倒する可能性があり、いつでも薬を服用したり、薬から離したりできます。

私の質問は、期間(日)に関してデータをどのように構造化する必要があるか、具体的には日の間で重複する必要があるかどうかです。私の構造が間違っていると思う理由は2つあります。1つは一見間違っているようNです。期間は単一の日(つまり、ここで私はまた、いくつかのエラーを取得していますtime1=4time2=4)およびこれらをコード化する必要があるかわかりませんよ。後続のエントリの開始時刻は、前のエントリの停止時刻にする必要がありますか?私はそれを両方の方法で試しました(オーバーラップありとオーバーラップなし)。オーバーラップがあると警告が表示されNなくなりますが、それでも正しくありません。

Warning message:
In Surv(time = c(0, 2, 7, 15, 20, 0, 18, 27, 32, 35, 39, 46, 53,  :
  Stop time must be > start time, NA created

現在、次のエントリの開始が翌日になるようにデータを設定しています。ユニークな患者はによって識別されますchart numbers

Time1    Time2    Drug1    Drug2   Event    ChartNo
    0        2        1        0       0        123
    3       10        1        1       1        123
   11       14        1        1       1        123
    0       11        0        1       0        345
    0       19        1        0       1        678
    0        4        0        1       0        900
    5       18        1        1       0        900

患者123は、開始から2日目に薬剤1を服用しており、その後、薬剤2を追加しました。彼らは最初に落ちる前に両方の薬物で3日目から10日目に行き、その後両方の薬物でまだ14日目に2回目落ちました。患者345は、落下することなく(その後、検閲されました)、drug2で11日間行きました。

実際の見積もりは次のようになります。

S <- Srv(time=time1, time2=time2, event=event)
cox.rms <- cph(S ~ Drug1 + Drug2 + cluster(ChartNo), surv=T)

私の主な懸念は、n私の分析では2017(データの行数)が報告されていること314です。これが正常なのか、それとも途中でエラーが発生したのかはわかりません。

> cox.rms$n
Status
No Event    Event 
    1884      133 

coxph()サバイバルパッケージから使用する場合も同様です。

 n= 2017, number of events= 133

イベントの数は正しいです。

この投稿には、私が説明した「オーバーラップ」が設定されているNようですが、についてはよくわかりませんID


この+cluster(ChartNo)用語は、繰り返される観察の懸念に対処する必要があります。別のアプローチは+ (1|subject)、coxme :: coxme分析に追加することです。
DWin

回答:


1

データのフォーマットは正しいです。

再発イベントと、時変共変量である薬剤の追加された複雑さのために、患者ごとに複数のレコードがあります。使用して印刷した出力headは、これらのデータを理解するのに役立ちます。

再発イベントと時変共変量を分析するための一般的なアプローチは、データを「長い」フォーマットにフォーマットすることです。この場合、各行はリスク共変量観測の間隔を表します。たとえば、患者123が時刻0から時刻2まで薬剤1のみを使用しており、時刻3から薬剤1と薬剤2の両方を摂取するように変更されていることがわかります。彼らがドラッグ1だけを服用し続けた場合、彼らの転倒がどれだけ長く続くかわからないため、その時点で検閲されます。時間3に、彼らは両方の薬を7時間単位で服用している患者としてコード化されたコホートに再び入り、その後、最初の転倒を経験します。彼らはたった4時間単位後に同じ薬物の組み合わせで2回目の落下を経験します。

レコード数は、コホートデータの有用な要約ではありません。行数が患者数よりはるかに多いのも当然です。代わりに、開始から停止までの時間を合計し、リスクのある人の時間として記録します。コホートの分母は発生率を理解するのに役立ちます。患者の生の数を要約することも役立ちますが、データは「長い」形式であるため、データセットの行数よりも少ないことに注意してください。

エラーについては、「停止」日に1ユニット追加する必要があると思います。患者123が0、1、2日目に薬剤1を服用し、3日目に薬剤2を開始した場合、薬剤1の転倒の危険性が3日間ありましたが、2-0 = 2であり、これは正しくありません分母。

「クラスター」引数が(通常)行うのは脆弱性です。これは、いくつかの測定されていないリスク要因に起因する比例リスクの違いが何であるかを説明する一種のランダムインターセプトです。弱々しい分析はあまりしません。「cluster」コマンドを省略して、結果を発生率として解釈できます。代わりに、すべての患者の最初の転倒までの時間のcoxモデルを当てはめ、ハザード比をリスク比として解釈できます。脆弱性の結果はこの2つの中間のどこかにあるはずだと思います。解釈がどうあるべきか、私はまったくはっきりしていません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.