私は保険リスク予測モデルの開発に取り組んでいます。これらのモデルは、航空会社のノーショー予測、ハードウェア障害検出などの「まれなイベント」のものです。データセットを準備していたため、分類を適用しようとしましたが、否定的なケースの割合が高いため、有用な分類子を取得できませんでした。
私は高校の統計コース以外に統計とデータのモデリングの経験があまりないので、ちょっと混乱しています。
最初に思ったように、私は不均質なポアソンプロセスモデルを使用することを考えています。イベントデータ(日付、緯度、経度)に基づいて分類し、特定の場所の特定の日の特定の時間におけるリスクの可能性を適切に推定しました。
知りたいのですが、まれなイベントを予測するための方法論やアルゴリズムは何ですか?
この問題に取り組むためのアプローチとして何をお勧めしますか?