インターバル打ち切り


8

R、JMP、SASで区間検閲生存曲線を実行しました。どちらも同じグラフを提供してくれましたが、表は少し異なりました。これは、JMPから提供されたテーブルです。

Start Time  End Time    Survival    Failure SurvStdErr
.            14.0000      1.0000     0.0000     0.0000
16.0000      21.0000      0.5000     0.5000     0.2485
28.0000      36.0000      0.5000     0.5000     0.2188
40.0000      59.0000      0.2000     0.8000     0.2828
59.0000      91.0000      0.2000     0.8000     0.1340
94.0000     .             0.0000     1.0000     0.0000

これは、SASから提供されたテーブルです。

Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1    14    16      0.5          0.5             0.5        0.1581
2    21    28      0.0          0.5             0.5        0.1581
3    36    40      0.3          0.8             0.2        0.1265
4    91    94      0.2          1.0             0.0        0.0

Rの方が出力が小さかった。グラフは同じで、出力は次のとおりです。

Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2

私の問題は:

  1. 違いがわかりません
  2. 結果の解釈方法がわかりません...
  3. 私はメソッドの背後にある論理を理解していません。

あなたが私を、特に解釈で助けてくれるなら、それは大きな助けになるでしょう。結果を数行に要約する必要がありますが、表の読み方がわかりません。

残念ながら、サンプルには、イベントが発生した間隔の10件の観測しかなかったことを付け加えておきます。偏った中点代入法を使いたくありませんでした。しかし、私には(2,16]の2つの間隔があり、生き残ることができない最初の人は分析で14で失敗したので、それがどのように機能するかわかりません。

グラフ:

ここに画像の説明を入力してください


1
実際に、RそしてSAS完全に一致:SAS4つの区間の代わりに、3、含まれますが CDFが区間2に変更されませんのでご注意を!実際、JMP結果も同様ですが、理解するのが少し難しいです。
クリフAB

回答:


1

ここで最も重要な問題は、検閲の理解と、状況に適用されるタイプです。したがって、問題1.と3.について、問題のコンテキストを理解してください。これは、適切な打ち切り方法を定義するのに役立ちます。

R出力は、失敗の最初のグループが間隔(14,16]にあることを示しています。これは、14で失敗が発生したことを意味しません。これは、Rがデータを右打ち切りであると仮定したことを意味します。生存分析の場合。失敗が16の確率だけでなく範囲(14,16)として引用されるのはなぜですか?これは、信頼限界の推定が原因である可能性があります。

SASに類似したRの結果の解釈:t = 16での失敗の確率は50%、t = 40での確率は30%、t = 94での確率は20%です。

3つの分析パッケージを使用して問題を理解することを忘れてください。1つを選択し、打ち切りに設定できるオプションを理解して、それを使用します。Rの良いリンク:ここ


質問のコンテキストは、状態の再発です。再発の時期に興味があります。残念ながら、フォローアップの訪問は毎日ではないので、訪問番号4で再発が起こった場合、3(+ 1日)と4の間のどこで起こったかはわかりません。打ち切りは右打ち切りであり、10個の観測値のうち、(94、無限大)になるように打ち切られたのは1つだけです。50%が28日以上生存したと言って間違いないでしょうか?
user45442 2014年

もう1つの質問、間隔の打ち切りは未知のデータに基づいているため、10個の観測に基づく推定はどの程度効率的ですか?推定値は、中間点補完の偏った方法で得られる推定値よりも実際に優れていますか?
user45442 2014年

1
50%が28日以上生き残ったとは言えません。あなたが指摘した間隔のあいだの不確かさの理由だけでそれを知らないからです。50%は16日目まで生き残ったと言えます。間隔の問題に関しては、データの不正確さに関連する非常に現実的な問題を提起します。中点代入法を使用することは理にかなっていますが、状況に広く受け入れられているアプローチは、カプランマイヤー推定です。
Gary Chung

3
@GaryChung:このデータの区間検閲の側面を完全に無視しています
クリフAB
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.