Cox回帰とTobit回帰の関係は何ですか？

7

打ち切りデータを処理するために、Tobit回帰のような打ち切り回帰法を使用する研究者もいれば、Cox回帰のような古典的な生存分析モデルを使用する研究者もいます。

数学の観点から、Cox回帰とTobit回帰は2つの異なるモデルであることを知っています。

私の質問：これらの2つの方法の長所と短所は何ですか？彼らはそれぞれどのような問題を解決するのが得意ですか？それらは異なる仮定を持っていますか？

regression survival censoring

— ミュンヘンゴン
ソース

3

省略されたモデルの説明

Coxモデルは、基礎となるベースライン分布を仮定する必要なく、観測されたデータのランクを通じてハザード比を巧みにモデル化する生存モデルですが、比例ハザードの仮定が必要です。

Tobitモデルは、打ち切りデータも処理できることを除いて、基本的に標準的な線形回帰です。その場合、想定される分布は正規です。

長所と短所

コックスモデル：

長所：ベースラインの分布を想定する必要はありません。これは生存分析にとって非常に重要です。イベントまでの時間データは非常に正常ではない傾向があり、多くの場合、右裾が非常に重い傾向があります。さらに、データのランクのみを考慮することで、予想される外れ値に対してより堅牢なモデルが得られます。

短所：係数効果の解釈が非常に難しい場合があります。

Tobitモデル：

プロ：検閲を可能にするために、ほとんどのアナリストが既に精通しているモデルの単純な拡張。つまり、すべてのデータが観察され、線形回帰に適切である場合（「短所」セクションで1つの警告が述べられている場合）、Tobitモデルを使用するのが適切です。。

短所：線形効果とガウス誤差の仮定が必要です。一部のアプリケーションでは、これは完全に適切ですが、イベントまでの時間データ（つまり、生存分析）がその基準に一致することはほとんどありません。また、それの価値はトービットモデルがあることを指摘し、よりバニラ線形回帰よりも正規性の仮定に敏感。

— クリフAB
ソース

（指数）Cox回帰係数はハザード比（HR）として解釈され、ハザードは結果の発生の瞬間的なリスクです。健康科学では、HRを結果がまれな場合に適切なリスク比として解釈することが多いのですが、説明するのは難しい場合もあります。

— AdamO 2018年

2

正規分布誤差項も線形リンクも、ほとんどの状況でイベント発生までの時間をモデル化するのに適切な選択ではありません。故障時間の分布は、大まかに正しい傾向にある傾向があります。

打ち切りのないモデルの場合、故障時間分析に関する書籍のほとんどでパラメトリックモデルについて説明されています。これらは、指数関数、ガンマ、またはワイブルの最尤法です。イベント時間を対数変換すると、線形回帰モデルの適用が正当化される可能性があるため、Tobitモデルには、打ち切りを伴う対数正規データのパラメトリックモデルにある程度の適用性があります。イベントまでの時間データの対数正規回帰モデルの理論的根拠は、私の意見では疑わしいようです。正規分布データは、何百万もの測定されていない要因の合計が結果に寄与するときに発生します。逆に、指数モデルとワイブルモデルは、より詳細に説明された確率モデルであり、マルチンゲールプロセスの微分方程式の解として導出され、単純なハザード関数によって要約されます。

Coxモデルは、障害時間の分布を気にしません。これはセミパラメトリックであるため、ハザードが比例的であれば、パラメトリックモデルの一般的なクラスで機能します。Coxモデルは、部分的な尤度を使用してリスクセットをランク付けします。各結果で疾患のリスクがある人々のグループを評価し、任意のベースラインハザード関数に従って尤度の比率を評価します。打ち切られた観測は、後続の分析から単純に削除されます。基礎となる分布が何であるか/そうでないかについて可能な限り少ないと仮定しながら、データを最大限に活用することにほとんど同意します。

— アダモ
ソース

tobitモデルはパラメトリック生存モデルとどのように関連していますか？Tobitモデルは対数正規パラメトリック生存モデルと同等ですか？

— Munichong、2018年