ダイナミックタイムワーピングは時代遅れですか?


7

http://www.speech.zone/exercises/dtw-in-python/それは言います

もはや実際には使用されていませんが、ダイナミックタイムワーピング(DTW)は、ダイナミックプログラミングの主要な概念の優れた入門書です。

信号処理にDTWを使用していますが、少し驚いています。代わりに何が使用されていますか?


深層学習による音声認識では、代わりにCTCが使用されます。
Emre

回答:


6

DTWが古くなっているとはまったく思いません。2006年にXiら。そのことを示した

[...]時系列分類の問題に対して多くのアルゴリズムが提案されています。ただし、ダイナミックタイムワーピング(DTW)距離を持つ1つの最近傍点を打ち破ることは非常に難しいことは明らかです。

このペーパーの結果は、Theophano Mitsaの著書「Temporal Data Mining」に次のように要約されています。

  • [Che05a]では、静的な最小化-最大化アプローチにより、7.2%の最大誤差が生じます。1NN-DTWでは、元の記事と同じデータセットでのエラーは0.33%です。
  • [Che05b]では、マルチスケールヒストグラムアプローチにより、最大誤差が6%になります。1NN-DTWでは、(同じデータセットの)エラーは0.33%です。
  • [Ead05]では、文法に基づく特徴抽出アルゴリズムにより、13.22%の最大エラーが発生します。1NN-DTWでは、エラーは9.09%でした。
  • [Hay05]では、ラプラシアン固有マップとDTW距離を使用して、時系列が低次元空間に埋め込まれます。著者は、100%というすばらしい精度を達成しました。ただし、1NN-DTWは100%の精度も達成しました。
  • [Kim04]では、隠れマルコフモデルは98%の精度を達成し、1NN-DTWは100%の精度を達成しています。
  • [Nan01]では、多層パーセプトロンニューラルネットワークが1.9%のエラー率という最高のパフォーマンスを実現しています。同じデータセットで、1NN-DTWの率は0.33%でした。
  • [Rod00]では、ブースト付きの1次論理はエラー率3.6%を与えます。同じデータセットで、1NN-DTWのエラー率は0.33%でした。
  • [Rod04]では、DTWベースの決定木は4.9%のエラー率を与えます。同じデータセットで、1NN-DTWは0.0%のエラーを出します。•[Wu04]では、スーパーカーネルフュージョンセットは0.79%のエラー率を示しますが、同じデータセットでは、1NN-DTWは0.33%を示します。

言及された参考文献のリストについては、元の本を参照してください。

ここで注意すべき重要な点は、Xi et al。2006年にはMLPのパフォーマンスを上回りました。最近の状況は少し違っているように見えるかもしれません(手元にあるより優れた高速なディープラーニングアルゴリズムがあるため)、DTWはいつ調査するのに有効なオプションであると考えます信号の分類になります。

更新

また、2016年の「グレートタイムシリーズ分類の成功:最近提案されたアルゴリズムの実験的評価」というより最近の論文へのリンクも追加したいと思います。この論文では、著者は「18の最近提案されたアルゴリズムを共通Javaフレームワークを使用して、それらを2つの標準ベンチマーク分類子(および相互)と比較しました。」紙からの次の引用は、DTWが実際に(または少なくとも2016年に)本当に関連していることを強調しています。

  1. アルゴリズムの多くは、実際には、2つのベンチマーク分類器である1-NN DTWとRotation Forestよりも優れています。
  2. 新しい問題の予測モデルの構築を検討している場合は、DTW、RandF、RotFを基本的な健全性チェックとベンチマークとして開始することをお勧めします。
  3. DTWに勝るのは難しいという知恵が得られました。

4

ダイナミックタイムワーピング(DTW)は2次の複雑さを持っています。このアルゴリズムには、FastDTW(線形複雑度)など、近似を計算することで複雑さを軽減するバージョンがいくつかあります。FastDTWは、たとえばこのPythonモジュールに実装されています


0

私が知る限り、改善されたのは主に計算面に関するものであるため、シーケンス間の類似性を測定するための適切な方法です。

私はお勧めこれを良い参照、特別セクション4.3として。このセクションの太字部分は次のとおりです。

ワーピングパスWは、2つの時系列間のマッピングを定義する一連の隣接する行列インデックスです。可能なワーピングパスが指数関数的に存在する場合でも、最適なパスは、グローバルワーピングコストを最小化するパスです。DTWは、複雑な時間O(n2)の動的計画法を使用して計算できます[Ratanamahatana and Keogh 2004a]。ただし、計算を高速化するために、いくつかの下限測定値が導入されています。Keoghと​​Ratanamahatana [2005]は、最大許容ワーピングを表す上限と下限のエンベロープの概念を導入しました。この手法を使用すると、複雑度はO(n)になります。DTWワーピングウィンドウのサイズに一時的な制約を課すこともできます。これらは、拡張ワーピングによって導入される病理学的マッチングを回避するため、速度だけでなく精度のレベルも向上させることが示されています[Ratanamahatana and Keogh 2004b]。最もよく使用される2つのグローバル制約は、Sakoe-Chiba BandとItakura Parallelogramです。Salvador and Chan [2007]は、ワープパスをより高い解像度に再帰的に投影し、それをリファインすることにより、DTWの線形時間計算を可能にするFastDTWアルゴリズムを導入しました。このアルゴリズムの欠点は、概算であるため、ACM Computing Surveys、Vol。45、No。1、Article 12、発行日:2012年11月。12:18 P. EslingおよびC. Agonは、最適なソリューションを見つけることを保証していません。動的ワーピングに加えて、時系列をグローバルにスケーリングして意味のある結果を達成できると便利な場合があります。これは、均一スケーリング(US)として知られている手法です。Fuら。[2008]は、DTWの利点と米国の利点を組み合わせることができるスケーリングおよびワープマッチング(SWM)の類似性測定を提案しました。空間組立距離(SpADe)などの他の形状ベースの測定値が導入されました[Chen et al。2007b]; これは、パターンに基づく類似性の尺度です。このアルゴリズムは、時間軸と振幅軸の両方でシフトとスケーリングを可能にすることにより、一致するパターンを識別します。DISSIM [フレンツォスら。2007]距離は、さまざまなサンプリングレートでの類似性を処理するために導入されました。ユークリッド距離の積分の近似値として定義されます。最も興味深い最近の提案の1つは、時系列の弾性マッチングの概念に基づいています[Latecki et al。2005]。Latecki et al。[2007]は、距離計算に最適なサブシーケンスとワーピングファクターを自動的に決定できる最適なSuBsequenceマッチング(OSB)手法を紹介しました。要素をスキップするとペナルティが含まれます。最適性は、高い計算コストによって実現されます。ただし、スキップ範囲を制限することで削減できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.