私は検閲とは何か、そして生存分析でどのように検閲する必要があるかについて読んだことがありますが、数学的定義のより少ない定義とより直感的な定義を聞きたいです(写真は素晴らしいでしょう!)誰でも1)検閲と2)カプラン・マイヤー曲線やCox回帰のようなものにどのように影響するかの説明を提供できますか?
私は検閲とは何か、そして生存分析でどのように検閲する必要があるかについて読んだことがありますが、数学的定義のより少ない定義とより直感的な定義を聞きたいです(写真は素晴らしいでしょう!)誰でも1)検閲と2)カプラン・マイヤー曲線やCox回帰のようなものにどのように影響するかの説明を提供できますか?
回答:
打ち切りは、しばしば切り捨てと比較して説明されます。2つのプロセスの説明は、Gelman et al(2005、p。235)によって提供されています。
打ち切られたデータは打ち切られたデータとは異なり、打ち切りポイントを超える観測値のカウントは利用できません。打ち切りでは 、切り捨てポイントを超える観測値は失われますが、その数は観測されます。
打ち切りまたは切り捨ては、あるレベルを超える値(右打ち切り)、あるレベルを下回る値(左打ち切り)、またはその両方で発生する可能性があります。
以下に、ポイント(中央)で打ち切られた、または(右)で打ち切られた標準正規分布の例を見つけることができます。サンプルが切り捨てられる場合、切り捨てポイントを超えるデータはなく、切り捨てポイントより上の打ち切られたサンプル値は境界値に「丸められ」、サンプルで過剰に表現されます。
直観的な検閲の例は、回答者に年齢を尋ねるが、ある値までしか記録せず、この値を超えるすべての年齢、たとえば60歳は「60+」として記録されることです。これにより、非検閲値に関する正確な情報が得られ、検閲値に関する情報は得られません。
それほど一般的ではありませんが、インターネット上でかなり注目を集めたポーランドのmatura試験のスコアで、実際の検閲の例が観察されました。試験は高校終了時に行われ、生徒は高等教育に申請できるように合格する必要があります。以下のプロットから、学生が試験に合格するために必要なポイントの最小量を推測できますか?当然のことながら、打ち切り境界のすぐ上で過剰に表現されたスコアの適切な割合を取ると、そうでなければ正規分布の「ギャップ」を簡単に「埋める」ことができます。
生存分析の場合
個々の生存時間に関する情報がある場合に打ち切りが発生しますが、生存時間は正確にはわかりません
(Kleinbaum and Klein、2005、p。5)。たとえば、患者を薬で治療し、研究を終了するまで観察しますが、研究が終了した後に患者に何が起こるか(再発や副作用がありましたか?)、あなたが知っている唯一のことは「少なくとも研究の終わりまで生き残った。
以下に、Kaplan–Meier推定器を使用してモデル化されたワイブル分布から生成されたデータの例を示します。青い曲線は、完全なデータセットで推定されたモデルを示し、中央のプロットでは、打ち切られたサンプルと打ち切られたデータ(赤い曲線)で推定されたモデルを見ることができ、右側では、切り取られたサンプルとそのようなサンプルで推定されたモデル(赤い曲線)を示します ご覧のとおり、欠損データ(切り捨て)は推定値に大きな影響を及ぼしますが、標準の生存分析モデルを使用して打ち切りを簡単に管理できます。
これは、切り捨てられたサンプルを分析できないことを意味しませんが、そのような場合、不明な情報を「推測」しようとする欠損データのモデルを使用する必要があります。
クラインバウム、DGおよびクライン、M。(2005)。生存分析:自己学習テキスト。スプリンガー。
ゲルマン、A。、カーリン、JB、スターン、HS、およびルービン、DB(2005)。ベイジアンデータ分析。チャップマン&ホール/ CRC。
打ち切りは生存分析の中心です。
基本的な考え方は、情報は検閲され、あなたには見えないということです。簡単に説明すると、サンプル内の全員が死亡する前に寿命を記録すると、寿命の打ち切り分布が得られます。X軸上で「右」に移動する時間を考えると、これは右打ち切りと呼ばれます。
他のタイプもあります:左打ち切りとウィンドウ打ち切り。例えば、有益な紹介については、Sageが発行したイベント履歴分析に関する1984年のAllisonのテキストを参照してください。
例:人口の離婚率を計算する場合、離婚のリスクがある(つまり、結婚している)個人のみを含めます。人々が離婚(死別、廃止)以外の理由で結婚を終了した場合、あなたは彼らを検閲したいと思います。彼らはもはや離婚の危険にさらされていません。Kaplan-Meierの推定値(およびプロット)には、打ち切られた時点以降の打ち切り観測値を含めるべきではなく、その時点までの観測値を含める必要があります。