Cox回帰と時間スケール


9

Cox比例ハザード回帰分析のX(ハザード)変数は常に時間でなければなりませんか?そうでない場合、例を挙げていただけますか?

がん患者の年齢は危険変数である可能性がありますか?もしそうなら、それは特定の年齢でがんになるリスクと解釈できますか?コックス回帰は、遺伝子発現と年齢との関連を研究するための正当な分析でしょうか?

回答:


8

通常、ベースライン時の年齢は共変量として使用されます(多くの場合、疾患/死亡に関連するため)。これは、時間尺度としても使用できます(十分な情報が必要なため、いくつかの縦断的研究で使用されていると思います)時間スケールに沿って危険にさらされている人々、しかし私は実際には思い出せません- コホート研究について話す連続的な時間スケール想定したコホート研究の分析に関するこれらのスライドを見つけただけです)。解釈では、イベント時間を年齢で置き換える必要があり、診断時の年齢を共変量として含めることができます。これは、特定の疾患の年齢別の死亡率を調査する場合に役立ちます(これらのスライドに示されています)。

この記事は、調査期間と年代順の2つのアプローチを対比させているため、興味深いかもしれません。Coxモデルのタイムスケール:エントリの年齢間の変動の係数推定への影響。ここに別の論文があります:

Cheung、YB、Gao、F、およびKhoo、KS(2003)。診断時の年齢とがん疫学における生存分析法の選択Journal of Clinical Epidemiology、56(1)、38-43。

しかし、確かにより良い論文があります。


@chi:どうもありがとうございました。書類を見てみます。最初の質問にコメントしていただけませんか?ハザード変数は常に時間ですか?
yuk

@yuk必ずしもそうではありませんが、@ whuberによって提案されています。学生がテストを完了するのに十分な時間がない場合に発生する、教育テストでの欠落した応答の体系的なパターンの処理を扱うCox回帰の別のアプリケーションを覚えています(欠落した応答は右打ち切りと見なされる場合があります)- -この場合、これは時間スケールと見なされるアイテムの順序です。元の論文を見てみましょう(ただし、これも博士号の対象だったと思います)。
CHL

+1。他にも論文はありますが、それらが必ずしも優れているとは思いません。チャリーズは状況を要約するかなり良い仕事をしていると思います。
ARS

7

いいえ、必ずしも時間である必要はありません。多くの打ち切られた応答は、生存分析手法でモデル化できます。デニスヘルセルは、彼の著書「Nondetects and Data Analysis」で、時間の代わりに濃度の負の値を使用することを提唱しています(非検出に対処するため、否定すると右打ち切り値になります)。概要は、ウェブ(PDF形式)とRパッケージで提供され、NADAは、これを実現します。


+ 1、NADAパッケージを指摘していただきありがとうございます。サバイバルパッケージを介して左打ち切りデータの処理が容易になることに気づきました-左打ち切りは環境データの一般的なシナリオですか?
ARS

@whuber:コメントをありがとう、NADAパッケージは非常に興味深く見えます。

@Andy:リンクをありがとう。答えは価値があると思います。私は賛成です。

@Yuk、あなたのリクエストに応じて、私は私のコメントを回答にして、@ whuberはあなたの例に感謝します。
Andy W

@ars:はい、左打ち切りは環境データの特徴です(そして、ケモメトリックス全般の主要な懸念事項です)。それはトリッキーで興味深い問題です。理由の1つは、(1)打ち切り限界自体が(キャリブレーションプロセスを通じて)統計的推定によって決定される、(2)打ち切りが複数の方法で発生する可能性がある-検出限界、定量限界、または「レポート限界」として( 3)しきい値は、元の打ち切り値と強く相関している可能性がある共変量(「マトリックス干渉」)に応じて変化することがよくあります。(4)データは対数正規分布していることがよくあります。
whuber

4

年齢スケールと時間スケールの問題について、chlにはいくつかの優れたリファレンスがあり、必須事項をキャプチャしています。特に、縦断的研究で発生するように、リスクのあるセットにすべての年齢の十分な被験者が含まれている必要があります。

これについては一般的なコンセンサスはまだありませんが、特定のケースでは時間スケールとして年齢を優先する必要があることを示唆する文献がいくつかあります。特に、一部の有毒物質への曝露などにより、すべての被験者について時間が同じように蓄積されない状況がある場合は、年齢の方が適切な場合があります。

一方、開始時の固定共変量ではなく、時変共変量として年齢を使用することにより、時間スケールのCox PHモデルでその特定の例を処理できます。どの時間スケールがより適切であるかを理解するために、研究対象の背後にあるメカニズムについて考える必要があります。新しいスタディを設計する前に、両方のモデルを既存のデータに適合させて、矛盾が発生するかどうか、およびそれらがどのように説明されるかを確認することは価値がある場合があります。

最後に、2つを分析する際の明らかな違いは、年齢スケールでは生存の解釈が絶対スケール(年齢)に関連しているのに対し、時間スケールでは、研究の開始/開始日に関連しているということです。 。


3

OPの要求に従って、空間コンテキストで使用された生存分析(whuberによって言及された環境物質の測定とは明らかに異なります)を私が見た別のアプリケーションは、空間内のイベント間の距離のモデリングです。犯罪学の例が1つ、疫学の例が1つあります。

イベント間の距離を測定するために生存分析を使用することの背後にある理由は、打ち切りの問題とは言えません(打ち切りは間違いなく空間的なコンテキストで発生する可能性があります)。ただし、イベント間の時間特性とイベント間の距離の分布が類似しているためです。特性(つまり、どちらもOLSに違反する同様のタイプのエラー構造(多くの場合、距離減衰)を持っているため、ノンパラメトリックソリューションは両方に理想的です)。


引用の習慣が悪かったため、上記のリンクへの正しいリンク/参照を見つけるために何時間も費やす必要がありました。

犯罪学の例として、

菊池、ジョージ、雨宮守、斉藤友紀、島田貴仁、原田豊。2010. 日本におけるほぼ繰り返される犠牲者の時空間分析。第8回全国犯罪マッピング会議。ジルダンド犯罪科学研究所。PDFは現在、参照先のWebページで入手できます。

疫学では、

リーダー、スティーブン。2000.生存分析を使用して地理疫学における空間点パターンを研究する。社会科学と医学50(7-8):985-1000。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.