ストリームデータの分類器のインクリメンタルオンライン学習の手法


9

この抽象的な問題に直面するための良いテクニックはどれですか?

物理的なセンサーからのデータのように、連続信号のデータストリームがあります。その信号には実際の(離散化された)値があり、属性はありません。依存性の特徴(例:パワー、自己相関、エントロピー)が抽出される場合があります。有限セットの1つのラベルを信号のウィンドウに割り当てることができます。このラベルをトレーニングラベルにします。ウィンドウの始点と終点、およびウィンドウラベルを選択する必要があります。

信号が受信されたときと同じように、タスクは次のウィンドウをオンラインで分類することです。

私はインクリメンタルアルゴリズムを求めています。より多くのトレーニングラベルが与えられれば、検出パフォーマンスが向上するという意味です。ただし、トレーニングラベルが1つしかない場合でも分類できる必要があります。

Windows境界の検出が原因で問題が難しすぎる場合は、小さな定数でサイズを修正できるとしましょう。したがって、アルゴリズムは信号の小さなスライスを分類し、同じラベルを持つ隣接するスライスをマージします。その簡略化されたアプローチを使用する場合は、それが合理的である理由を正当化してください。

回答:


2

これがバイナリ分類の問題である場合、Bordes、A.やBottou、L.のような「The Huller:シンプルで効率的なオンラインSVM」、ECML 2005などのオンラインSVMを適用できるはずです。

これが非バイナリ分類(つまり、2つ以上の可能なラベル)である場合は、カーネルの再帰的最小二乗法を調べることができます。これらはオンライン回帰用に作られていますが、オンライン分類でもかなりうまく機能します。ここに、1つの基本的なKRLSアルゴリズムがあります。Y 。エンゲル、S。マナー、およびR.メイヤー、「カーネル再帰最小二乗アルゴリズム」、IEEEトランス。信号処理、2004年

これらのアプローチはどちらも、同じサイズの入力ベクトルを比較するために固定ウィンドウサイズを必要とします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.