時系列データの教師なし学習アルゴリズムはありますか?


9

私のデータの各観測は、0.1秒の差で収集されました。日付とタイムスタンプがないため、時系列とは呼びません。クラスタリングアルゴリズム(オンラインで見つけた)とPCAの例では、サンプルデータにはケースごとに1つの観測値があり、時間は計測されていません。しかし、私のデータには、車両ごとに0.1秒ごとに収集された何百もの観測があり、多くの車両があります。

注:私は定足数についてもこの質問をしました。


1
言語に注意してください。あなたの質問は完全に不明確です。「サンプルデータにはケースごとに1つの観測値があり、時間測定されていない」とはどういう意味ですか?
Kasra Manshaei、

1
オンラインチュートリアルで見つけた例について話していました。彼らが使用するサンプルデータには、ケース/個人(顧客、国など)ごとに1つの観測値しかありません。そして、それらのデータは時系列ではありません。
umair durrani 2015年

回答:


7

あなたが持っているのは時間によるイベントのシーケンスですので、それを時系列と呼ぶのをためらわないでください!

時系列のクラスタリングには2つの異なる意味があります。

  1. 時系列のセグメンテーション。つまり、内部の類似性に従って個々の時系列を異なる時間間隔にセグメント化する場合。
  2. 時系列クラスタリング、つまりいくつかの時系列があり、それらの間の類似性に従って異なるクラスターを見つけたい場合。

私はあなたが2番目のものを意味すると思います、そしてここに私の提案があります:

あなたは多くの車両と車両ごとの多くの観測を持っています。つまり、あなたは多くの車両を持っています。したがって、いくつかの行列(各車両は行列)があり、各行列にはN行(観測のNr)とT列(時間点)が含まれています。1つの提案は、PCAを各マトリックスに適用して次元を削減し、PCスペースでデータを観察し、マトリックス(車両)内の異なる観察間に意味のある関係があるかどうかを確認することです。次に、すべての車両の各観測を相互に配置して行列を作成し、PCAをそれに適用して、異なる車両間の単一の観測の関係を確認できます。

負の値がない場合は、行列形式データの次元削減のために行列因数分解を強くお勧めします。

別の提案として、すべての行列を互いに重ね合わせて、N x M x Tテンソルを作成することができます。ここで、Nは車両の数、Mは観測数、Tは時系列であり、テンソル分解を適用して関係をグローバルに確認します。

時系列クラスタリングへの非常に優れたアプローチがこのホワイトペーパーに示されていますが、実装は単純です。

お役に立てば幸いです。

幸運を :)


編集

あなたが言ったようにあなたは時系列セグメンテーションを意味します私はこれを答えに追加します。

時系列のセグメンテーションは、評価の根拠となる唯一のクラスタリング問題です。確かにあなたは時系列の背後に生成分布を考えると、私は強くお勧めします、それを分析し、これをこのこのこのこの、およびこの問題を総合的に研究されています。特に最後の1つと博士論文。

幸運を!


1
素晴らしい答えをありがとう。実際、私の目標は、データセット内の各車両に対して「時系列のセグメンテーション」を行うことです。
umair durrani 2015年

1
時系列分解のチュートリアルを勉強しています。それらをトレンド、季節、周期的な要素に分解する方法があることがわかりました。私の時系列は、しかし、数秒の車両の軌跡です。観測された軌道内の加速度、速度、先行車の速度、および加速度の傾向に基づいて、それらを異なる運転行動コンポーネントに分解することは可能ですか?
umair durrani 2015年

2
多分!これは、「分解」と「セグメンテーション」の両方を検討するのに適しています。たとえば、時系列がPC空間で重要なクラスターを示している場合、それらを運転行動に関連付けることができます。セグメンテーションは、時系列内のさまざまな運転行動を検出することもできます。簡単に言えば、1台の車両のさまざまな運転行動セグメントのセグメンテーションと、すべての車両の全体的な運転行動を検出する分解手法を使用できるということです。
Kasra Manshaei、2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.