なぜ寸法を小さくすることが重要なのかわかりません。一部のデータを取得してその次元を削減することの利点は何ですか?
なぜ寸法を小さくすることが重要なのかわかりません。一部のデータを取得してその次元を削減することの利点は何ですか?
回答:
特異値分解(SVD)は、データの次元数を削減することと同じではありません。これは、マトリックスを他のマトリックスに分解する方法であり、ここでは説明しませんが、多くの素晴らしいプロパティがあります。SVDの詳細については、ウィキペディアのページをご覧ください。
データの次元を削減すると、非常に役立つ場合があります。観察よりも多くの変数がある可能性があります。これはゲノム研究では珍しいことではありません。たとえば、それらが少数の潜在的な要因の影響を大きく受けている場合など、非常に高い相関があるいくつかの変数があり、潜在的な要因への近似を回復したい場合があります。主成分分析、多次元スケーリング、正準変量分析などの次元削減技法により、他の方法では取得できない可能性のある観測値や変数間の関係についての洞察が得られます。
具体例:数年前、100を超える質問があった従業員満足度調査を分析していました。まあ、どのようなマネージャーも、回答の100以上の質問の価値を見て、要約することはできません。そして、それが何を意味するのかを推測する以上のことはできません。 ?私は10,000を超える観測結果が得られたデータに対して因子分析を実行し、全体を要約するマネージャー固有のスコア(因子ごとに1つ)を作成するために使用できる5つの非常に明確で容易に解釈可能な因子を導き出しました100以上の質問アンケート。以前の結果報告方法であったExcelスプレッドシートダンプよりもはるかに優れたソリューションです。
質問の2つ目のポイントに関して、データセットの次元削減の利点は次のとおりです。
それ以外に、PCAを超えて、SVDには信号処理、NLPなどの多くのアプリケーションがあります。
私のこの答えを見てください。特異値分解は、主成分分析の主要なコンポーネントです。これは、非常に便利で強力なデータ分析手法です。
顔認識アルゴリズムでよく使用されており、私はヘッジファンドアナリストとしての日常業務で頻繁に使用しています。