タグ付けされた質問 「pca」

主成分分析(PCA)は、線形次元削減手法です。これは、多変量データセットを、できるだけ多くの情報(できるだけ多くの分散)を維持する、構築された変数のより小さなセットに削減します。主成分と呼ばれるこれらの変数は、入力変数の線形結合です。

28
主成分分析、固有ベクトル、固有値を理解する
今日のパターン認識クラスでは、私の教授がPCA、固有ベクトル、固有値について話しました。 私はそれの数学を理解しました。固有値などを見つけるように求められたら、機械のように正しく行います。しかし、私はそれを理解しませんでした。目的がわからなかった。私はそれを感じませんでした。 私は次の引用を強く信じています: あなたはそれをあなたの祖母に説明できない限り、あなたは本当に何かを理解していません。 - アルバート・アインシュタイン まあ、私はこれらの概念を素人やおばあちゃんに説明することはできません。 なぜPCA、固有ベクトル、固有値なのか?これらの概念の必要性は何ですか? これらを素人にどのように説明しますか?

3
SVDとPCAの関係。SVDを使用してPCAを実行する方法
主成分分析(PCA)は通常、共分散行列の固有分解によって説明されます。ただし、データ行列特異値分解(SVD)を介して実行することもできます。どのように機能しますか?これら2つのアプローチの関係は何ですか?SVDとPCAの関係は何ですか?XX\mathbf X または、言い換えると、データ行列のSVDを使用して次元削減を実行する方法ですか?

14
因子分析と主成分分析の違いは何ですか?
私が使用する統計パッケージの多くは、これら2つの概念をまとめているようです。ただし、一方を他方に対して使用するために真実でなければならない異なる仮定またはデータの「形式」があるのではないかと思っています。実際の例は信じられないほど便利です。


6
主成分分析は、連続変数とカテゴリー変数が混在するデータセットに適用できますか?
連続データとカテゴリデータの両方を含むデータセットがあります。PCAを使用して分析していますが、分析の一部としてカテゴリ変数を含めることは問題ないでしょうか。私の理解では、PCAは連続変数にのみ適用できるということです。あれは正しいですか?カテゴリデータに使用できない場合、分析にはどのような選択肢がありますか?


1
PCAを逆にし、いくつかの主成分から元の変数を再構築する方法は?
主成分分析(PCA)は、次元削減に使用できます。このような次元削減が実行された後、少数の主成分から元の変数/機能をどのように近似的に再構築できますか? あるいは、データから複数の主成分をどのように削除または破棄できますか? 言い換えれば、PCAを逆にする方法は? PCAが特異値分解(SVD)と密接に関連していることを考えると、次のように同じ質問をすることができます。SVDを逆にする方法は?


4
PCAと分散の割合の説明
一般に、PCAのような分析における分散の割合は、最初の主成分によって説明されると言うことは何を意味しますか?誰かがこれを直感的に説明できますが、主成分分析(PCA)の観点から「分散の説明」の意味を正確に数学的に定義することもできますか?バツxx 単純な線形回帰の場合、最適な直線のr乗は常に説明された分散の割合として記述されますが、それをどうするかはわかりません。ここでの分散の割合は、最適なラインからのポイントの偏差の延長ですか?

3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

6
EFAの代わりにPCAを使用する正当な理由はありますか?また、PCAは因子分析の代わりになりますか?
一部の分野では、PCA(主成分分析)が正当化されることなく体系的に使用され、PCAとEFA(探索的因子分析)は同義語と見なされます。 そのため、最近、PCAを使用してスケール検証研究の結果を分析しました(7ポイントのリッカートスケールで21項目、それぞれ7項目の3つの因子を構成すると仮定)。両方の手法の違いについて読みましたが、ここでの回答の大部分では、PCAに対してEFAが好まれているようです。 PCAの方が適している理由には、何か理由がありますか?私の場合、どのようなメリットがあり、なぜ賢明な選択になるのでしょうか?


4
正準相関分析の機能を視覚化する方法(主成分分析の機能と比較して)
正準相関分析(CCA)は、主成分分析(PCA)に関連する手法です。散布図を使用してPCAまたは線形回帰を教えるのは簡単ですが(Googleの画像検索に関する数千の例を参照)、CCAの同様の直感的な2次元の例を見たことはありません。線形CCAの機能を視覚的に説明する方法

4
R関数prcompとprincompの違いは何ですか?
QモードとRモードの主成分分析(PCA)について比較?prcompし?princompてみました。しかし正直なところ、私はそれを理解していません。誰でも違いを説明できますか?
70 r  pca 

5
PCAでのローディングと固有ベクトル:いつ使用するか?
主成分分析(PCA)では、固有ベクトル(単位ベクトル)と固有値を取得します。今、私たちのように負荷を定義してみましょうLoadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. 固有ベクトルは単なる方向であり、負荷(上記で定義)にはこれらの方向に沿った分散も含まれることがわかっています。しかし、理解を深めるために、固有ベクトルの代わりにロードを使用する場所を知りたいのですが?例は完璧でしょう! 一般に、固有ベクトルを使用している人しか見ていませんが、時々(上記で定義したように)負荷を使用するため、その違いを本当に理解していないと感じています。
67 pca 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.