混乱しているので、まずは問題を述べ、質問を一つずつ取り上げてみましょう。あなたは万のサンプルサイズがあり、各サンプルは、特徴ベクトルによって記述されている。あなたがガウス放射基底関数を使用して回帰を実行する場合は、フォームの機能を探しているF (X )= Σ jを W J * のG J(X 、μ J、σ J)、J = 1 ... M グラムのIx∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
giあなたの基本機能です。具体的には、あなたが見つける必要が
重み
W jで指定されたパラメータになるように
μ J及び
σ jのあなたがとの間の誤差最小化
Yと対応する予測
Y =
F (Xの)mwjμjσjyy^f(x^)通常は、最小二乗誤差を最小化します- 。
Mu添え字jパラメーターとは正確には何ですか?
基底関数g jを見つける必要があります。(あなたはまだ数を決定するために必要なメートルを各基底関数があります)μ Jとσ jの(未知の)。下付き文字jの範囲は1からmです。mgjmμjσjj1m
あるベクトル?μj
はい、ポイントです。言い換えれば、それは特徴空間のどこかにあり、m個の基底関数のそれぞれについてμを決定する必要があります。R31μm
これが基底関数の位置を支配することを読んだことがあります。これは何かの平均ではありませんか?
基底関数を中心とするμ Jjthμj。これらの場所の場所を決める必要があります。いいえ、それは必ずしも何かの平均ではありません(しかし、それを決定する方法については下を参照してください)
さて、「空間スケールを支配する」シグマについて。それは正確に何ですか?
σ基底関数自体に目を向けると、方がわかりやすくなります。
やR 2などの低次元のガウス動径基底関数を考えると役立ちます。でR 1ガウスラジアル基底関数は単に周知釣鐘曲線です。もちろん、ベルは狭くても広くてもかまいません。幅はσによって決まります。σが大きいほど、ベルの形状は狭くなります。つまり、σはベル形状の幅をスケーリングします。したがって、σ = 1の場合、スケーリングはありません。大きなσの場合R1R2R1σσσσσがかなりのスケーリングがあります。
これの目的を尋ねることができます。ベルがスペースの一部(線)をカバーしていると考える場合、狭いベルは線のごく一部しかカバーしません*。ベルの中心に近いポイントxのg j(x )値は大きくなります。中心から遠く離れたポイントは、g j(x )の値が小さくなります。スケーリングには、ポイントを中心から遠ざける効果があります。ベルが狭くなると、ポイントは中心から遠くに位置するため、g j(x )の値が小さくなります。R1xgj(x)gj(x)gj(x)
各基底関数は入力ベクトルxをスカラー値に変換します
はい、あなたはいくつかの点で基底関数を評価している。x∈R31
exp(−∥x−μj∥222∗σ2j)
結果としてスカラーを取得します。スカラー結果は、点の距離に依存中心からμ Jによって与え‖ X - μ J ‖及びスカラーσのJ。xμj∥x−μj∥σj
このパラメーターに対して.1、.5、2.5などの値を試す実装をいくつか見てきました。これらの値はどのように計算されますか?
これはもちろん、ガウス動径基底関数を使用することの興味深く困難な側面の1つです。Webを検索すると、これらのパラメーターの決定方法に関する多くの提案が見つかります。クラスタリングに基づく1つの可能性を非常に簡単な用語で説明します。あなたはこれと他のいくつかの提案をオンラインで見つけることができます。
10000個のサンプルをクラスタリングすることから始めます(最初にPCAを使用して次元を縮小し、次にk-Meansクラスタリングを行うことができます)。を見つけるクラスターの数とすることができます(通常、相互検証を使用して最適なmを決定します)。次に、クラスターごとに動径基底関数g jを作成します。各ラジアル基底関数について聞かせてμ jは、クラスタの中心(例えば平均、重心など)こと。してみましょうσ jが(例えば半径が...)今、先に行くと、あなたの回帰を実行するクラスタの幅を反映した(この簡単な説明は、それが各ステップでの作業の多くを必要とするだけの概要-です!)mmgjμjσj
*もちろん、ベルカーブはから∞の範囲で定義されるため、ライン上のどこにでも値があります。ただし、中心から遠く離れた値は無視できます∞∞