この質問に答えるためにカオス理論を読んだときに私が発見した最も奇妙なことは、データマイニングとその親がカオス理論を活用する公開された研究の驚くべき不足でした。これは、AB belambelの応用カオス理論:複雑さのパラダイムやAlligoodなどのChaos:An Introduction to Dynamical Systems(後者はソースブックとして非常に有用ですこのトピック)と彼らの書誌を襲撃します。結局、私は適格である可能性のある単一の研究を思い付くだけでした、そして私はこのエッジケースを含めるためだけに「データマイニング」の境界を広げなければなりませんでした:テキサス大学のチームで、ベロソフ・ザボチンスキー(BZ)反応(すでに非周期性の傾向があることがすでに知られている)の研究を行っているチームが、カオスパターンのために実験で使用されたマロン酸の不一致を偶然発見し、新しい探索を促すサプライヤー。[1] おそらく他にもあります-私はカオス理論の専門家ではなく、文献を徹底的に評価することはほとんどできません-しかし、物理学からの三体問題のような通常の科学的用途との厳しい不均衡は、すべてを列挙してもほとんど変わりません。実際、この質問が閉じられた暫定的に、「データマイニングおよび関連分野にカオス理論の実装がそれほど多くないのはなぜか」というタイトルで書き直すことを検討しました。これは、データマイニングおよび関連するアプリケーションに多数のアプリケーションが存在するべきであるという不明確でありながら広範な感情とは一致しませんニューラルネット、パターン認識、不確実性管理、ファジーセットなどのフィールド。結局のところ、カオス理論は多くの有用なアプリケーションを備えた最先端のトピックでもあります。私の検索が無意味で、私の印象が間違っている理由を理解するために、これらのフィールド間の境界がどこにあるのかを正確に長く考えなければなりませんでした。
; tldr回答
研究の数と期待からの逸脱におけるこの深刻な不均衡の簡単な説明は、カオス理論とデータマイニングなどが2つのきちんと分離されたクラスの質問に答えているという事実に帰することができます。それらの間の鋭い二分法は、一度指摘されると明らかですが、自分の鼻を見るのと同じように、気付かれないほど基本的です。カオス理論とデータマイニングのようなフィールドの相対的な新しさが実装の不足を説明しているという信念にはある程度の正当性があるかもしれませんが、これらのフィールドが明確に異なる側面に対処するため、これらのフィールドが成熟しても相対的な不均衡が持続すると予想できます同じコイン。これまでのほとんどすべての実装は、明確な出力を備えた既知の機能の研究であり、偶然にもいくつかの不可解なカオス収差を示していました。一方、データマイニングと、ニューラルネットや決定木のような個々の手法はすべて、未知または不十分に定義された関数の決定を伴います。同様に、パターン認識やファジーセットなどの関連フィールドは、その手段も明らかではない場合、未知または定義が不十分な関数の結果の組織として見ることができます。これにより、特定のまれな状況でのみ交差できる、実際に乗り越えられないキャズムが作成されますが、これらも単一のユースケースのルーブリックの下でグループ化できます:データマイニングアルゴリズムとの非周期的な干渉の防止。同様に、パターン認識やファジーセットなどの関連フィールドは、その手段も明らかではない場合、未知または定義が不十分な関数の結果の組織として見ることができます。これにより、特定のまれな状況でのみ交差できる、実際に乗り越えられないキャズムが作成されますが、これらも単一のユースケースのルーブリックの下でグループ化できます:データマイニングアルゴリズムとの非周期的な干渉の防止。同様に、パターン認識やファジーセットなどの関連フィールドは、その手段も明らかではない場合、未知または定義が不十分な関数の結果の組織として見ることができます。これにより、特定のまれな状況でのみ交差できる、実際に乗り越えられないキャズムが作成されますが、これらも単一のユースケースのルーブリックの下でグループ化できます:データマイニングアルゴリズムとの非周期的な干渉の防止。
カオスサイエンスワークフローとの非互換性
「カオスサイエンス」の典型的なワークフローは、分岐図、エノンマップ、ポアンカレ断面、位相図、位相軌跡などの位相空間の視覚的補助とともに、既知の関数の出力の計算分析を実行することです。研究者が計算実験に依存しているという事実は、カオス効果を見つけるのがいかに難しいかを示しています。通常、ペンと紙で判断できるものではありません。また、非線形関数でのみ発生します。このワークフローは、既知の機能を使用しない限り実行できません。データマイニングでは、回帰式、ファジー関数などが得られる可能性がありますが、それらはすべて同じ制限を共有しています。これらは、一般的な近似であり、エラーのウィンドウがはるかに広くなっています。対照的に、カオスの影響を受ける既知の機能は比較的まれであり、カオスパターンを生成する入力の範囲と同様に、カオス効果をテストする場合でも高度な特異性が必要です。未知の関数の位相空間に存在する奇妙なアトラクタは、定義や入力が変更されると確実にシフトまたは消失し、Alligoodなどの著者によって概説された検出手順を大幅に複雑にします。
データマイニング結果の汚染物質としてのカオス
実際、データマイニングとその関連物とカオス理論の関係は、実際には敵対的です。これは、暗号化スキームでカオスを活用することに関する少なくとも1つの研究論文に出くわしたことを考えると、暗号解析をデータマイニングの特定の形式として広く見る場合、文字通り当てはまります(現時点では引用を見つけることができませんが、リクエストに応じてダウンします)。データマイナーにとって、カオスの存在は通常悪いことです。なぜなら、無意味に見える値の範囲が出力するように見えるため、未知の関数を近似するすでに困難なプロセスが大幅に複雑になる可能性があるからです。データマイニングおよび関連フィールドでのカオスの最も一般的な使用法は、それを除外することです。混oticとした影響が存在するが検出されない場合、データマイニングベンチャーに対する影響を克服するのは困難です。普通のニューラルネットまたは決定木がカオスアトラクターの見かけ上無意味な出力をどれだけ簡単にオーバーフィットするか、または入力値の突然のスパイクが回帰分析を確実に混乱させ、不良サンプルまたは他のエラーの原因に帰着する可能性があることを考えてください。すべての関数と入力範囲の間でカオス効果が発生することはほとんどないため、実験者はそれらの調査の優先度を大幅に下げることになります。
データマイニング結果でカオスを検出する方法
カオス理論に関連する特定の尺度は、コルモゴロフエントロピーや位相空間が正のリアプノフ指数を示すという要件など、非周期的な効果を識別するのに役立ちます。これらはABҪambelの応用カオス理論で提供されているカオス検出のチェックリスト[2]の両方にありますが、ほとんどは既知の制限のある明確な関数を必要とするリアプノフ指数などの近似関数には役立ちません。それでも彼が概説する一般的な手順は、データマイニングの状況で役立つ可能性があります。アムベルの目的は、最終的に「カオス制御」、つまり干渉する非周期的効果を排除するプログラムです。[3]カオスにつながる分数次元を検出するためのボックスカウントおよび相関次元の計算など、他の方法は、データマイニングアプリケーションでは、リアプノフや彼のリストにある他の方法よりも実用的かもしれません。カオス効果のもう1つの明白な兆候は、関数の出力に周期の2倍(または3倍以上)のパターンが存在することです。これは、多くの場合、フェーズ図の非周期(つまり「カオス」)動作に先行します。
接線アプリケーションの差別化
この主なユースケースは、カオス理論に正接的にのみ関連するアプリケーションの別のクラスと区別する必要があります。よく見ると、私が質問で提供した「潜在的なアプリケーション」のリストは、カオス理論が依存する概念を活用するためのアイデアで構成されていましたが、非周期的な動作がない場合は独立して適用できます(期間の倍増は除く)。私は最近、局所的な最小値からニューラルネットワークをポップする非周期的な動作を生成する、新しい潜在的なニッチの使用を考えましたが、これも接線アプリケーションのリストに属します。それらの多くは、カオス科学の研究の結果として発見または肉付けされましたが、他の分野にも応用できます。これらの「接線アプリケーション」は、互いにファジーな接続のみを持ちながら、明確なクラスを形成します。データマイニングにおけるカオス理論の主なユースケースからハードな境界によって分離されています。前者は非周期的パターンなしでカオス理論の特定の側面を活用し、後者はデータマイニング結果の複雑な要因としてカオスを排除することに専念します。 。カオス理論とそれが正しく利用する他の概念を区別する場合、前者の応用は通常の科学研究で既知の機能に本質的に制限されていることがわかります。カオスのない状態でこれらの二次概念の潜在的な応用に興奮することには、本当に正当な理由があります。データマイニングが存在する場合、予期しない非周期的な動作がデータマイニングに及ぼす影響を心配する理由もあります。そのような場合はまれですが、その希少性は、それらが検出されないことを意味する可能性があります。Ҫambelの方法は、このような問題を防ぐのに役立つかもしれません。
[1] pp。143-147、Alligood、Kathleen T .; Sauer、Tim D.およびYorke、James A.、2010年、Chaos:An Introduction to Dynamical Systems、Springer:New York。[2] pp。208-213、Ҫambel、AB、1993、Applied Chaos Theory:A Paradigm for Complexity、Academic Press、Inc .: Boston。[3] p。215、アンベル。