遺伝的アルゴリズムのパラメーターの選択


9

特定のシステムをモデル化するために、遺伝的アルゴリズムに適切な数のパラメーターをどのように選択できますか?

たとえば、自動車の生産を最適化したいとし、1,000人の異なる従業員ごとに、さまざまなタスクで時間効率を1,000回測定したとします。つまり、1,000,000個のデータポイントがあります。これらのほとんどは弱いあなたの工場の全体的な効率と相関する可能性が高いが、そうではありませんので、あなたは、彼らは統計的信頼度とは無関係であると言うことができるという弱いです。1,000,000以上の自由度がなくなり、収束が非常に遅くなるか、まったく収束しないように、GAの入力を選択するにはどうすればよいですか?

具体的には、機能を事前選択または選択的に削除するために使用できるアルゴリズムは何ですか?

私は、このシナリオで自分自身を使用している一つのアプローチは、私のような両親かもしれないので、パラメータの選択自体を進化させている{a,b,c}{b,d,e,q,x,y,z}などを。次に、子を変更して機能を追加または削除します。これは、数十の機能に適しています。しかし、問題は、自由度が多数あると効率が悪いことです。その場合は、10^n組み合わせ(上記の例では)を調べています10^1,000,000。これにより、何らかの有用なパフォーマンスを得るには、機能の事前フィルタリングが重要になります。

回答:


11

まず第一に、おそらくこれを解決するために回帰または古典的なMLメソッドを使用するため、この例はあまり適していないと思われます。次に、特徴選択 (Kira、Rendell、1992)または属性選択 (Hall、Holmes、2003)または変数選択 (Guyon、Elisseeff、2003)または変数サブセット選択 (Stecking、Schebesch、2005)の一般的な問題を参照しています。または特徴抽出 (Hillion、Masson、Roux、1988)または次元削減 (Roweis、Saul、200)または状態抽象化 (Amarel、1968)。この問題は、遺伝的アルゴリズムだけでなく、高次元のデータを扱うときのほとんどすべての機械学習技術に関連しています。

ここでは3つのケースを区別できます。状態の抽象化と呼ばれるこの問題の最後のインスタンスは、通常、プロセスモデリングに関連しています(これは、GAコンテキストではなく、例に適しています)。最初の3つ、つまり、機能選択属性選択、または変数選択は、質問を文字どおりに取る場合に最も関連性があるようです。このコンテキストでの一般的な解決策は、このためのmRMRアプローチ(Peng、Long、Ding、2005)。私の経験では、連続データでは常にうまく機能するとは限りませんが、相互情報は、相関などの他の係数で置き換えることができます。別の可能なアプローチは、交差検証を使用することです(Picard、Cook、1984)です。それぞれ異なる機能を使用する複数のモデルを持つことができ、交差検証手法を使用したモデル選択により、最適なモデルを選択します。これにより、特定のタスクに最適な機能に関する情報が得られます。

特徴抽出次元削減例は初期機能するだけでなく、その組み合わせを選択するだけでなく、許可します。このケースのよく知られたソリューションの例は、PCAアルゴリズム(ピアソン、1901)です。。これは、説明された分散の観点から、入力フィーチャの線形結合であるフィーチャのセットを生成します。

また、特徴抽出タスクを単独で処理する多くのモデルがあることにも注意してください。いくつかの例は次のとおりです。GrowingNeural Gas Network (Fritzke、1995)、LASSO (Tibshirani、2011)、RFE SVM (Zeng、Chen、Tao、2009)、Decision Trees (Quinlan、1986)

参照:


3

私はこれまでこれまでに行ったことはなく、明らかにそのデータにアクセスすることはできませんが、これを行うための潜在的に良い方法は、クラスタリングを使用することです。各従業員について、n次元のベクトルがあり、各次元は異なるタスクに対応しています。次に、クラスタリングを使用して、「類似した」従業員をグループ化できます。ただし、これはデータにのみ依存します。つまり、クラスタリングによって1000人の従業員しか与えられない場合、実際にはそれほど関連性のない従業員のグループが生成される可能性があります。そのため、人口は減少しますが、情報が失われる可能性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.