回答:
これは非常に広範な質問であり、単一の回答で包括的にカバーすることは不可能だと思います。したがって、関連する回答やリソースへのポインタを提供する方が有益だと思います。これは、私の次の情報と考えを提供することで私がやることです。
まず、Microsoft ResearchのBurges(2009)による次元削減に関する優れた包括的なチュートリアルに言及する必要があります。彼は、モノグラフ全体を通して、データの高次元の側面に頻繁に触れています。この作業では、次元削減を次元削減と呼び、問題の理論的な紹介を行い、射影法と多様体モデリング法で構成される次元削減法の分類法を提案し、各カテゴリの複数の方法の概要を示します。
レビューされた「射影追跡」法には、独立成分分析(ICA)、主成分分析(PCA)およびその変動(カーネルPCAおよび確率的PCAなど)、正準相関分析(CCA)およびそのカーネルCCA変動、線形判別分析(LDA)が含まれます)、カーネル次元縮小(KDR)およびその他のいくつか。マニホールド審査方法には、多次元スケーリング(MDS)とそのランドマークMDSの変化、Isomap、ローカルでのリニアの埋め込みラプラシアン固有マップやスペクトルクラスタリングなどのグラフィカルな方法。元の出版物がオンライン(上記のリンク)またはオフライン(参照)でアクセスできない場合に備えて、ここにレビュー済みのメソッドのほとんどをリストしています。
上記の作業に適用した「包括的」という用語には注意点があります。かなり包括的なものですが、これは相対的であり、次元削減へのアプローチのいくつかはモノグラフで議論されていません。特に、観測不可能な(潜在)変数に焦点を当てたものです。しかし、それらのいくつかは、別のソースへの参照で言及されています-次元削減に関する本。
ここで、関連する回答または関連する回答を参照して、問題のトピックのいくつかのより狭い側面を簡単に説明します。高次元データへの最近傍(NN)タイプのアプローチに関しては、ここで私の回答を参照してください(リストの4番目のペーパーを確認することを特にお勧めします)。次元の呪いの効果の1つは、高次元データが頻繁にまばらであることです。この事実を考えると、こことここでの回帰とスパースで高次元のデータのPCAに関連する答えが役立つと思います。
参照資料
バージ、CJC(2010)。次元削減:ガイド付きツアー。Foundations andTrends®in Machine Learning、2(4)、275-365。doi:10.1561 / 2200000002