回帰の目的で予測子の次元を減らすことの利点は何ですか?


11

次元削減回帰(DRR)または教師付き次元削減(SDR)技法の、従来の回帰技法(次元削減なし)に対するアプリケーションまたは利点は何ですか?これらのクラスの技法は、回帰問題の特徴セットの低次元表現を見つけます。このような手法の例には、スライスされた逆回帰、主ヘシアン方向、スライスされた平均分散推定、カーネルスライスされた逆回帰、主成分回帰などが含まれます。

  1. 交差検証されたRMSEに関して、次元削減を行わない回帰アルゴリズムでアルゴリズムのパフォーマンスが向上した場合、回帰の次元削減の実際の用途は何ですか?これらのテクニックの要点はわかりません。

  2. これらの手法は、たまたま、回帰のための空間と時間の複雑さを減らすために使用されていますか?それが主な利点である場合、この手法を使用する際の高次元データセットの複雑さの軽減に関するリソースが役立つでしょう。これについては、DRRまたはSDR技術自体を実行するにはある程度の時間とスペースが必要であるという事実について議論します。このSDR / DRR +回帰は、低濃度のデータセットで、高濃度のデータセットでの回帰のみよりも高速ですか?

  3. この設定は抽象的な関心のみから研究されたもので、実用的なアプリケーションはありませんか?

余談ですが、特徴と応答同時分布が多様体上にあるという仮定が時々あります。回帰問題を解決するために、このコンテキストで観測されたサンプルから多様体を学習することは理にかなっています。YXY


1
:あなたは、次のブログ投稿が助けになることができるようにマニホールドの学習について話 normaldeviate.wordpress.com/2012/09/08/hunting-for-manifolds
HalvorsenのはKjetil B

回答:


5

多様体仮説によれば、データは低次元多様体にあると想定され、残差はノイズであることを意味するため、次元削減を正しく行う場合は、ノイズではなく信号をモデル化することでパフォーマンスを向上させる必要があります。それは単にスペースと複雑さの問題ではありません。


しかし、SIRのような手法が、次元数を削減した後、ロバストに改善しているとは思いません。誤りがある場合、またはこの信号を回帰設定でより適切に検出できるSDR / DDR手法を知っている場合は、修正してください。その手法(名前)を教えてください。
2014

もちろん、それは回帰アルゴリズムとデータの本質的な次元に依存します。特にSIRについて話すことはできませんが、ここでは、低次元であるMNISTデータセットのさまざまな回帰アルゴリズムを比較する論文を紹介します。たぶん、問題のあるデータを共有して、人々がそれを解読できるようにするかもしれません。
Emre、2014

「多様体仮説」とは?
アメーバはモニカを復活させます


私はこのようなものは、それはどこにでも偉大である必要があり、それ「のような音」という点で、ニューラルネットワークと非線形多次元尺度に似ているかどうか疑問が、実際には例より限定されたセットでもありません
shadowtalker

6

回帰の次元削減の目的は正則化です。

あなたがリストしたテクニックのほとんどはあまりよく知られていません。主成分回帰(PCR)以外は聞いていません。だから私はPCRについて返信しますが、同じことが他のテクニックにも当てはまることを期待しています。

ここでの2つのキーワードは、過剰適合正則化です。長い扱いと議論のために、The Elements of Statistical Learningを紹介します が、ごく簡単に言えば、予測子がたくさんあり()、サンプルが足りない()場合、標準回帰はデータに適合しすぎて、トレーニングセットではパフォーマンスが良いように見えるが、実際にはテストセットではパフォーマンスが非常に低いモデルを構築します。npn

極端な例では、予測変数の数は、サンプル数を超えた場合(人々がにとしてそれを参照問題)、あなたが実際にすることができます完璧にフィット任意の応答変数一見達成し、パフォーマンスを。これは明らかにナンセンスです。y 100 p>ny100%

過剰適合に対処するには、正則化を使用する必要があり、さまざまな正則化戦略がたくさんあります。一部のアプローチでは、予測子の数を大幅に減らし、問題を状況に減らしてから、標準回帰を使用しようとします。これはまさに主成分回帰が行うことです。The Elementsのセクション3.4--3.6を参照してください。通常、PCRは最適ではなく、ほとんどの場合、他のいくつかの正則化手法のパフォーマンスは向上しますが、理解と解釈は簡単です。pn

PCRも任意ではないことに注意してください(たとえば、次元をランダムに維持すると、パフォーマンスが大幅に低下する可能性があります)。これは、PCRがリッジ回帰に密接に関連しているためです。リッジ回帰は、さまざまなケースでうまく機能することが知られている標準的な収縮レギュライザーです。比較については、ここで私の回答を参照してください。リッジ回帰とPCA回帰の関係p

標準の回帰と比較してパフォーマンスの向上を確認するには、多数の予測変数を含み、サンプル数が少ないデータセットが必要です。また、交差検定または独立したテストセットを使用する必要があります。パフォーマンスの向上が見られなかった場合は、データセットに十分な次元がない可能性があります。

良い答えを持つ関連スレッド:


1
彼の出版物を考えると彼がこれを知っていると仮定しても安全です。
Emre、2014

おかげで、@エムレ、私はOPが誰であるかわからなかった。質問を誤解していたかもしれませんが、今読んでみてどう解釈したらよいのかわかりません。PCRの実用的な利点は何かを尋ねている場合、正解正則化です。PCRは実際には、最も標準的な正則化手法の1つであるリッジ回帰と密接に関連しています。
amoebaはモニカを復活させる'12

しかし、Elementsでも、ほとんどの場合LASSOがPCRに勝っているという印象を受けましたp>n
。PCR

@ssdecontrol:同意します。私はコンセンサスはPCRがほとんど非競争的であり、ほとんど常により良いアプローチがあることだと思います。これも私の回答で書いたものです(そうではありませんでしたか?)。しかし、質問は具体的には予測子の次元削減とその目的が何であるかについてでした。私の答えは、目的は正則化であるということです。
アメーバはモニカを復活させる'12

わかった。しかし、私たちは質問は具体的には、実際にその直感的な魅力にもかかわらず、正則化するための最良の方法ではないことを考えるとその有用性に挑戦するためにロードされることに同意することができると思う
shadowtalker
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.