Cox Proportional Hazards回帰やいくつかのKaplan-Meierモデルなどの従来の統計モデルを使用して、障害などのイベントの次の発生までの日数を予測できることを知っています。つまり、生存分析
ご質問
- GBMやニューラルネットワークなどの機械学習モデルの回帰バージョンを使用して、イベントが発生するまでの日数を予測するにはどうすればよいですか?
- 発生までの日数をターゲット変数として使用し、単に回帰モデルを実行するだけでは機能しないと思いますか?なぜ機能しないのか、どうすれば修正できますか?
- 生存分析問題を分類に変換してから、生存確率を取得できますか?その後、バイナリターゲット変数を作成する方法は?
- 機械学習アプローチとコックス比例ハザード回帰およびカプラン・マイヤーモデルなどの長所と短所は何ですか?
サンプル入力データが以下の形式であることを想像してください
注意:
- センサーは10分間隔でデータをpingしますが、NAの行で表されるように、ネットワークの問題などによりデータが欠落する場合があります。
- var1、var2、var3は予測変数、説明変数です。
- failure_flagは、マシンが失敗したかどうかを示します。
- マシンIDごとに10分間隔で6か月分のデータがあります
編集:
注:毎日のレベルで、今後30日間の各マシンの障害の可能性を予測します。
failure_flag
。