生存分析において、なぜ完全なパラメトリックモデルの代わりにセミパラメトリックモデル(Cox比例ハザード)を使用するのですか?


24

Cox Proportional Hazardsモデルを研究してきましたが、この質問はほとんどのテキストで取り上げられています。

コックスは、部分尤度法を使用してハザード関数の係数を適合させることを提案しましたが、最大尤度法と線形モデルを使用してパラメトリック生存関数の係数を適合させるだけではどうですか?

データを打ち切った場合は、曲線の下の領域を見つけることができます。たとえば、推定値が80の標準偏差で380であり、サンプルが300以上を打ち切られている場合、正規誤差を仮定した尤度計算でそのサンプルの確率は84%です。


ここで保険数理科学の質問をしたいのと同じように、この質問は統計サイトCross Validatedでおそらくより良い回答を得られると言わざるを得ません。モデレーターの移行をリクエストできます。
グラフ

わかった、それが存在することに気づかなかった。移行のリクエスト方法がわからない。移行してください?

@Graphth、また、それが存在することに気づきませんでした...「すべてのサイト」リストに見つかりませんでした。ここにリンクできますか?ありがとう

回答:


27

データが従うパラメトリック分布がわかっている場合は、最尤法を使用して、分布が意味をなします。Cox比例ハザード回帰の本当の利点は、分布を知らない(または仮定する)ことなく生存モデルを近似できることです。正規分布を使用して例を挙げますが、ほとんどの生存時間(およびCox PH回帰が使用される他のタイプのデータ)は、正規分布に近づきません。対数正規分布、ワイブル分布、またはその他のパラメトリック分布に従う場合もあります。その仮定をする意思がある場合、最尤パラメトリックアプローチは優れています。しかし、多くの現実世界のケースでは、適切な分布が何であるか(あるいは十分に近い近似でさえ)わかりません。打ち切りと共変量では、単純なヒストグラムを作成することはできず、「これは...分布のように見える」と言うことはできません。そのため、特定のディストリビューションを必要とせずにうまく機能するテクニックがあると非常に便利です。

分布関数の代わりにハザードを使用する理由は何ですか?次の声明を検討してください:「グループAの人々は、グループBの人々の80歳で死亡する可能性が2倍です」。グループBの人はグループAの人よりも長生きする傾向があるため、またはグループBの人は短命になり、ほとんどの人が80歳よりもずっと前に死亡している可能性が非常に低いため、グループAの十分な人数が80歳まで生きているうちに80歳で死亡し、その年齢でかなりの数の人が死亡し、その年齢で死亡する確率がはるかに高くなります。したがって、同じ声明は、グループAにいることはグループBにいることよりも良いか悪いことを意味する可能性があります.80 それがハザードです(ハザードは分布関数/生存関数などの関数です)。ハザードはセミパラメトリックモデルでの作業が容易であり、分布に関する情報を提供できます。


7
いい答えだ。時間についてユニークなのは、一方向に進むことであり、高リスク期間に耐えると、現在有効なリスクに主に関心があります。それがハザード関数が教えてくれることです。
フランクハレル

2
追加する価値があるもう1つの点は、打ち切りデータでは、分布の仮定を検査することが非常に困難になる可能性があることです。たとえば、被験者の20%のみがイベントを観察するとします。分布の裾がワイブル分布に従うかどうかを判断しようとすると、明らかに不可能になります!Aコックス-PHモデルはやや問題を回避し(しかし、あなたは非常に検閲された回の領域に外挿ししたい場合は、比例ハザード仮定の非常に警戒する必要はあり)
クリフAB

16

「私たち」は必ずしもそうではありません。生存分析ツールの範囲は、カプラン・マイヤー法のような完全にノンパラメトリックなものから、基礎となるハザードの分布を指定する完全なパラメトリックなモデルまであります。それぞれに長所と短所があります。

Cox比例ハザードモデルのようなセミパラメトリックメソッドを使用すると、基になるハザード関数を指定しなくても済みます。これは、基になるハザード関数を常に知っているわけではなく、多くの場合気にしないので、役立ちます。たとえば、多くの疫学研究では、「暴露XはイベントYまでの時間を短縮しますか?」彼らが気にするのは、Xを持っている患者とXを持たない患者の違いです。その場合、根本的なハザードは本当に重要ではなく、それを誤って指定するリスクはそれを知らない結果よりも悪いです。

ただし、これも当てはまらない場合があります。潜在的なハザード関心があったため、完全にパラメトリックなモデルで作業しました。


1
「...そして、それを誤って指定するリスクは、それを知らないことの結果よりも悪いです。」これはとても役に立ちました、ありがとう。

潜在的なハザードがいつ関心を引くか、例を挙げてください。
ダンシャルティエル

1
@DanChaltiel数学モデルなどに入るように意図された推定値は一例です-そこにある基本的なハザード関数は特に興味深いものです。
フォミテ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.