タグ付けされた質問 「factor-rotation」

8
PCAの後に回転(バリマックスなど)が続いているのはまだPCAですか?
私はRのSPSSから(PCAを使用して)いくつかの研究を再現しようとしました。私の経験では、パッケージからのprincipal() 関数はpsych、出力に一致する唯一の関数でした(または私の記憶が正しければ、完全に機能します)。SPSSと同じ結果を一致させるには、parameterを使用する必要がありましたprincipal(..., rotate = "varimax")。私は論文がPCAをどのようにしたかについて話しているのを見てきましたが、SPSSの出力と回転の使用に基づいて、それは因子分析のように聞こえます。 質問:PCAは、(を使用してvarimax)回転した後でもPCAですか?私はこれが実際に因子分析であるかもしれないという印象を受けていました...もしそうでない場合、どのような詳細が欠けていますか?

1
因子分析/ PCAで回転を行う背後にある直感的な理由と、適切な回転を選択する方法は何ですか?
私の質問 因子分析で因子(またはPCAのコンポーネント)の回転を行う背後にある直感的な理由は何ですか? 私の理解では、変数が最上位のコンポーネント(または要因)にほぼ均等にロードされる場合、コンポーネントを区別することは明らかに困難です。そのため、この場合、回転を使用してコンポーネントをより適切に区別できます。これは正しいです? 回転を行うとどうなりますか?これは何に影響しますか? 適切なローテーションを選択する方法は?直交回転と斜め回転があります。これらの選択方法と、この選択の意味は何ですか? 最小限の数式で直感的に説明してください。広範にわたる答えはほとんどありませんでしたが、私は直感的な理由と経験則でもっと探しています。

1
自由度は非整数の数値にできますか?
GAMを使用すると、残留DFは(コードの最終行)になります。どういう意味ですか?GAMの例を超えて、一般に、自由度の数を整数以外の数にすることはできますか?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

1
PCAが常に座標軸を回転させる場合、「回転」および「非回転」主成分とは何ですか?
私の知る限り、主成分は、座標軸を回転させて最大分散の方向に合わせることで得られます。 それにもかかわらず、私は「回転していない主成分」について読み続け、私の統計ソフトウェア(SAS)は、回転していない主成分だけでなく、バ​​リマックスで回転した主成分も提供してくれます。ここで混乱しています。主成分を計算するとき、軸はすでに回転しています。なぜ別の回転が必要なのですか?「回転していない主成分」とはどういう意味ですか?

3
Rのバリマックス回転主成分を計算する方法は?
25個の変数でPCAを実行し、を使用して上位7台のPCを選択しましたprcomp。 prc <- prcomp(pollutions, center=T, scale=T, retx=T) 次に、これらのコンポーネントでバリマックス回転を行いました。 varimax7 <- varimax(prc$rotation[,1:7]) そして今、私はvarimaxがPCAで回転されたデータを回転させたいと思っています(これはvarimaxオブジェクトの一部ではなく、負荷行列と回転行列のみです)。これを行うには、回転行列の転置にデータの転置を乗算することを読んだので、これを行っていました: newData <- t(varimax7$rotmat) %*% t(prc$x[,1:7]) しかし、上記の行列転置の次元はそれぞれおよびあるため、それは意味がありません。したがって、行ではなく、行のみの行列がます。ここで私が間違っていることや、最終的な行はどうなりますか?後で転置するだけですか?7 × 16933 7 169337×77×77\times 77×169337×169337 \times 16933777169331693316933
13 r  pca  factor-rotation 

2
因子ローテーションメソッド(varimax、obliminなど)-名前の意味とメソッドの役割
因子分析には、varimax、quartimax、equamax、promax、obliminなど、いくつかの回転方法があります。名前と実際の数学的または統計的処理とを関連付ける情報を見つけることができません。「equa-max」または「quarti-max」と呼ばれるのはなぜですか?軸や行列がどのように回転して、そのような名前が付けられますか? 残念ながら、それらのほとんどは1950年代から1970年代に発明されたので、著者に連絡することはできません。

2
探索的因子分析ソリューションを回転させずにおく理由はありますか?
探索的因子分析ソリューションをローテーションしない理由はありますか? 直交解と斜め解を比較する議論を見つけるのは簡単で、私はそのすべてを完全に理解していると思います。また、私が教科書で見つけたものから、著者は通常、因子分析の推定方法を説明することから、回転がどのように機能するか、いくつかの異なるオプションが何であるかを説明することにまっすぐ進みます。私が見たことがないのは、そもそもローテーションを行うべきかどうかという議論です。 おまけとして、因子を推定する複数の方法(たとえば、主成分法と最尤法)に有効な任意のタイプのローテーションに対して誰かが議論を提供できたら、私は特に感謝します。

2
因子分析(またはPCA)では、因子負荷が1を超えるとはどういう意味ですか?
斜め回転(プロマックス)を使用してFAを実行したところ、1つの因子で1.041の因子負荷が発生しました(パターンマトリックスを使用して、他の因子では-.131、-。119および.065の因子負荷)。 。そして、私はそれが何を意味するのかわかりません、私はそれが-1と1の間だけであることができると思っていました。 斜め回転によるものですか?そして、直交因子で負荷が1を超えることはできますか?

3
PCAコンポーネントを回転させて、各コンポーネントの分散を均等化します。
データセットに対してPCAを実行し、最後の数台のPCを破棄することで、データセットの次元とノイズを削減しようとしています。その後、残りのPCでいくつかの機械学習アルゴリズムを使用したいので、PCの分散を均等化してデータを正規化し、アルゴリズムをより適切に機能させたいと考えています。 簡単な方法の1つは、分散を単純に単位値に正規化することです。ただし、最初のPCには、次のデータセットよりも元のデータセットからの差異が多く含まれています。それでも、「重み」を付けたいと思います。したがって、私は疑問に思っていました:分散を分割して、分散の少ないPCと共有する簡単な方法はありますか? 別の方法は、PCを元の特徴空間にマッピングすることですが、その場合、次元も元の値に増加します。 結果の列を直交に保つ方が良いと思いますが、現時点では必要ありません。

3
PCA後の斜めローテーションの使用について
SAS、SPSS、Rなどのいくつかの統計パッケージでは、PCAの後にある種の因子ローテーションを実行できます。 PCAの後にローテーションが必要なのはなぜですか? PCAの目的が直交次元を生成することであるとすると、PCAの後に斜め回転を適用するのはなぜですか?

1
線形回帰の予測子としてのバリマックス回転PCAコンポーネントの使用
PCAを実行した後、最初のコンポーネントは変動性の最大の部分を記述します。これは、PC1軸がサイズの変動をキャプチャすることが一般的に知られている(Jolliffe、2002)身体測定の研究などで重要です。私の質問は、バリマックスローテーション後のPCAスコアが同じプロパティを保持するか、またはこのトピックで述べたようにそれらが異なるかどうかです。 さらなる統計分析のためにPCAスコアが必要なため、varimaxが必要かどうか、そして実際に実際のサンプルの変動性の表現を混乱させて、回転した軸上の個々のスコアが情報を得られない、または現実の誤解につながるのでしょうか? また、誰かがこのトピックに関する他の参考文献を提案できますか? Rのワークフロー: PCA(FactoMineRまたはprcomp)->個々のスコアを抽出->にスコアを入力lm PCA(FactoMinerまたはprcomp)->荷重行列のバリマックス->個々のスコアを計算->にスコアを入力lm FA(psych、バリマックス、PCA抽出方法)->個々のスコアを抽出->スコアをlm ここで、回転なし(1.)の説明された変動性のパーセンテージは、最初の3つの軸で29.32、5.6、3.2です。2.および3.ソリューションは、最初の3つの要因、つまり12.2、12.1、8.2で同様の割合を示します。もちろん、1。ソリューションはすべての高変動荷重を最初の軸にプッシュする傾向がありますが、2。および3.は軸間で荷重を分散する傾向があります(これが回転の理由です)。回転した軸と回転していない軸では個々のスコアが異なるため、これらの3つのワークフローが本質的に同じであるかどうか知りたいですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.