生存分析を実行できるpythonのパッケージがあるかどうか疑問に思っています。私はRでサバイバルパッケージを使用していますが、私の仕事をPythonに移植したいと思います。
survival
パッケージは、大規模なコミュニティによって綿密に調査されています。
生存分析を実行できるpythonのパッケージがあるかどうか疑問に思っています。私はRでサバイバルパッケージを使用していますが、私の仕事をPythonに移植したいと思います。
survival
パッケージは、大規模なコミュニティによって綿密に調査されています。
回答:
私の知る限り、Pythonには生存分析パッケージはありません。上記のmbqのコメントの通り、利用可能な唯一のルートはRpyになります。
利用可能な純粋なpythonパッケージがあったとしても、私はそれを使用する際に非常に注意します。特に、私は以下を見ます:
Rの利点の1つは、これらの標準パッケージが大量のテストとユーザーフィードバックを取得できることです。実際のデータを扱うとき、予期しないエッジケースが忍び寄ることがあります。
Pythonでのサバイバルモデルのシンプルでクリーンな実装については、ライフライン ¹プロジェクトをご覧ください。
利点:
ドキュメントはここから入手できます:ドキュメントと例
使用例:
from lifelines import KaplanMeierFitter
survival_times = np.array([0., 3., 4.5, 10., 1.])
events = np.array([False, True, True, False, True])
kmf = KaplanMeierFitter()
kmf.fit(survival_times, event_observed=events)
print(kmf.survival_function_)
print(kmf.median_)
kmf.plot()
組み込みプロットライブラリのプロットの例:
PyIMSLには、生存分析のためのいくつかのルーチンが含まれています。非営利目的での使用はビールとして無料で、その他の場合は完全にサポートされています。統計ユーザーガイドのドキュメントから...
生存確率のKaplan-Meier推定値を計算します:kaplanMeierEstimates()
Coxの比例ハザードモデルを使用して、生存および信頼性データを分析します:propHazardsGenLin()
一般化線形モデルを使用して生存データを分析します:survivalGlm()
さまざまなパラメトリックモードを使用した推定:survivalEstimates()
ノンパラメトリックアプローチを使用して、信頼性ハザード関数を推定します:nonparamHazardRate()
人口とコホートの生命表を生成します:lifeTables()
scikit-survivalについても言及したいと思います。これは、scikit-learnのツール(KFold交差検証など)と簡単に組み合わせることができる生存分析のモデルを提供します。
この記事の執筆時点では、scikit-survivalには以下の実装が含まれています