これは主に統計サイトであることを知っているので、トピックから外れている場合はリダイレクトしてください。
ポンプが故障して交換が必要になるシステムがあります。故障を予測して、ポンプを交換する人に早期に警告したい。流量、圧力、液体の高さなど、ポンププロセスの履歴データがあります。
私は機械学習技術を使用してデータを分類する経験が少ししかありません-基本的に、コースラでのAndrew Ngの機械学習コースとAndrew ConwayのStatistics Oneの演習を行い、実行しました-私は機械学習を使用したことがありません時系列を分類します。既存の知識を活用できるように問題を変革する方法を考えています。知識が限られているため、最適な予測は得られませんが、これから学びたいと思っています。この問題では、障害が発生するのを待つだけでなく、予測を少し改善するだけでも役に立ちます。
私が提案するアプローチは、時系列を通常の分類問題に変えることです。入力は、ウィンドウ内の各タイプのデータの平均値、標準偏差、最大値などを含む、時系列ウィンドウの要約になります。出力については、何が最適かわかりません。1つのアプローチは、出力がウィンドウの終わりから特定の期間内にポンプが故障したかどうかのバイナリ分類になるというものです。もう1つは、出力がポンプが故障するまでの残り時間であるため、分類ではなく、回帰(機械学習の意味)です。
このアプローチは結果を生む可能性が高いと思いますか?それは「ドメインと履歴データに依存する」という問題ですか。私が考慮していない(入力と出力の両方の)より優れた変換はありますか、または時系列データに基づく障害予測は、より標準的な障害予測とは異なり、時系列で機械学習を読むことに時間を費やすのに適していますか? ?