コックス比例ハザードモデルとランダムに選択されていないサンプル


9

非ランダムに選択されたサンプルによって引き起こされるコックス比例ハザードモデルのバイアスを修正する方法はありますか(ヘックマンの修正のようなもの)?

背景
次のような状況であるとしましょう。-
最初の2年間は、すべてのクライアントが受け入れられます。
-その2年後、Cox PHモデルが作成されます。モデルは、クライアントがサービスを使用する期間を予測します。
-今後の会社の方針により、3か月を超える確率が0.5を超えるクライアントのみが受け入れられ、それ以外は拒否されます。
-さらに2年後、新しいモデルを構築する必要があります。問題は、受け入れられたクライアントのみを対象としているため、これらのクライアントのみを使用すると、深刻なバイアスが生じる可能性があることです。


1
この分析のポイントは何ですか?Cox PHモデルは、いくつかの平滑化方法またはパラメトリックモデリングを組み込んでいない限り、故障までの時間を明示的に予測しません。このモデルにはどの層別化/調整変数がありますか?
AdamO

回答:


4

セミパラメトリックCoxモデルでのパラメトリックアプローチの計算の問題は、この特定の問題が実際には欠落データに関連していることです。モデルパラメータ(およびベースラインハザード関数の推定値)に基づくリスク予測がある場合、データの第2フェーズに含まれる確率があるため、著者はCoxモデルから絶対リスク予測を取得する方法を説明していませんコレクションは元のリスク予測に依存するため、欠落は観測された変数に依存します。つまり、ランダムデータで欠落します。
AdamO

2

単純な答えは重み付けです。つまり、重みを使用して、「受け入れられた」グループのグループを関心のある母集団に標準化できます。1年目と2年目の両方のフェーズを使用するプール分析でこのような重みを使用することから生じる問題は、推定される人口の重みとパラメーターが現在依存していることです。疑似尤度アプローチは通常使用され(この場合、これはある種の疑似部分尤度です)、サンプルの重みとパラメーター推定値の間の依存関係を無視します。ただし、多くの実際的な状況では(これも同じです)、この依存関係を考慮する必要があります。ハザード比の効率的な推定量を作成するという問題は難しい問題であり、私が知る限り、オープンエンドです。

疫学でのアプリケーション:二相成層サンプルからモデルパラメータのHorvitz-トンプソン推定を改善しました

この記事では、通常ロジスティック回帰に適用される調査方法について説明しますが、生存データにも重みを付けることができます。言及し忘れていたいくつかの重要な考慮事項は、母集団全体に適用される予測を作成するか、2年間の推定に基づいて「適格」な母集団に作成するか、または結果に基づいて「適格」な母集団に作成することに関心があるかです。モデル。Coxモデルからの近似値はリスクとして解釈できないため、そのような「予測」モデルがCoxモデルからどのように作成されるかについても正確には言及していません。ハザード比を推定し、ベースラインハザード関数の平滑化された推定値を取得するとします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.