生存分析と生活データ分析の全体像


10

サバイバル分析やライフデータ分析を聞いたことがありますが、全体像がよくわかりません。

彼らがカバーしているトピックは何だろうと思っていましたか?

それは純粋な統計ですか、それとも特定の領域の統計を適用しただけですか?

生涯分析は生存分析の一部ですか?

よろしくお願いします!

回答:


12

打ち切りの概念は、生存分析と生命データ分析の鍵です。この問題は、産業統計を介して入力することもできます。ユニットのサンプルが失敗するまでにかかる時間を監視する場合、

  • 完全なデータ:ユニットが故障する正確な時間は既知です
  • 右側の検閲:ユニットの故障時間は現在の実行時間を超えています
  • 左側の検閲:既知の時間はユニットが故障した時間の後です

データミックスに入るその他の問題は、

  • 単独検閲:故障していないすべてのユニットに共通のランタイムがあります
  • 複数の打ち切り:故障していないユニットの実行時間は異なります
  • 打ち切られた間隔:失敗する時間は、特定の時間セットの間であることがわかっています。
  • 打ち切り時間:打ち切り時間は固定です
  • 失敗の検閲:一定数のユニットが失敗すると、テストが停止します
  • 競合する故障モード:サンプルユニットはさまざまな理由で故障します

これらの状況を処理できる一般的な分布は、対数正規、ワイブル、および極値です。分析を処理するためのグラフィカルな手順、およびMLEとモーメント法のメソッドがあるため、問題は興味深いものになります。

システムの信頼性は、ベイジアン手法、更新理論、加速寿命試験に関わるこのトピックの派生物です。ウェイン・ネルソンとビル・ミーカーには、このトピックに関する優れた本がいくつかあります。


3
(+1)検閲は重要なアイデアです。時間は特定の(そして最も一般的な)アプリケーションにすぎません。たとえば、Dennis Helselは、検出限界(左打ち切り)を持つ化学測定に生存分析を適用しました。時間はかかりませんが、モデルと手法は引き続き役に立ちます。
whuber

8

生存分析について

生存分析またはイベント発生までの時間分析では、変数または関心は、開始点から、ある疾患による死亡などの関心のある点までの時間を測定します。したがって、応答変数は正の変数であり、ほとんどの場合は歪んでいます。結果として、通常の正規性の仮定は失敗し、たとえば、従来の回帰手法は適用できません。(ただし、変数の変換によって状況が改善される場合があることに注意してください)。ただし、主な違いは打ち切りです。イベントまでの時間データを処理する場合の非常に一般的な機能です。最も一般的な形式(右打ち切り)では、特定の個人の正確な時間はわかりませんが、特定の値よりも大きいことがわかりますt。たとえば、死亡まで患者を追跡するとします。当時のt=10日々、彼は生きています。当時のt=30彼はまだ生きているが、その後、彼はフォローアップに迷っています。次に、あなたは正確な死の時間を知りませんが、あなたはそれを知っていますt>30。検閲を無視することは明らかに最善の策ではありません。代わりに、あなたは記録することができますt=30検閲された観測として。生存分析の手法(カプランマイヤー推定、Cox回帰など)は、検閲を処理するように特別に設計されています。

私の見解では、医学研究における生存データのモデリングは、生存分析の最初の本として非常に良い選択です...しかし、他にもたくさんあります。


2
5, 10, 12+, 14, 17, 18+, 20+

生存分析の最初の近似の説明:従属変数が(1)正確な値(完全な観測)と(2)値が特定のしきい値(打ち切り観測)を超えることがわかっているデータを分析します。上記は生存データのサンプルである可能性があり+ます。の値+はより多いことがわかっていますが、それ以上ではありません。(そして多くの拡張機能があります。)


1

スケネクタディが指摘したように、検閲は生存分析の重要な問題です。データセットに打ち切り観測がなければ、タスクは単純な回帰タスクと何の違いもありません。これはまた、関心のある変数がT時間に制限されません。つまり、賃金、価格などです。

したがって、生存分析ではなく、打ち切り回帰または打ち切り分析と呼ぶ方が適切かもしれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.