タグ付けされた質問 「biplot」

バイプロットまたはデュアルプロットは、観測(サンプル)とデータの変数の両方を(ポイントまたはベクトルとして)提示する探索グラフです。軸は通常、潜在主次元です。バイプロットは、主成分分析、コレスポンデンス分析、およびその他の多変量法を表すためによく使用されます。

1
Biplotとの関係におけるPCAおよびコレスポンデンス分析
Biplotは、主成分分析(および関連する手法)の結果を表示するためによく使用されます。コンポーネントの負荷とコンポーネントのスコアを同時に表示するデュアルまたはオーバーレイ散布図です。本日、@ amoebaから、バイプロット座標がどのように生成/スケーリングされるかを尋ねる質問に対する私のコメントから離れた答えを彼が与えたと通知されました。そして彼の答えは、いくつかの方法をある程度詳細に検討しています。@amoebaは、私の経験をbiplotと共有するかどうかを尋ねました。 私の経験(理論と実験の両方)は、非常に控えめですが、それほど頻繁に認識されない2つのことを強調しています。(2)PCA、コレスポンデンス分析(およびその他の既知の手法)は、実際にはバイプロットの特定のケースです。または、少なくとも、彼らは双子の双子です。バイプロットを実行できる場合は、他の2つを実行できます。 あなたへの私の質問は次のとおりです:彼ら(PCA、CA、Biplot)はあなたのためにどのように接続されていますか?あなたの考えを共有してください。私はそれについて自分のアカウントを投稿しています。さらに回答を追加し、重要な発言をお願いします。

3
100万のPCAエディションを視覚化する
主成分分析の出力を、単なるサマリーテーブルよりも多くの洞察を与える方法で視覚化することは可能ですか?〜1e4など、観測数が多い場合に実行できますか?そして、R [他の環境も歓迎]でそれを行うことは可能ですか?

2
主成分分析におけるバイプロットの解釈
この素晴らしいチュートリアルに出くわしました。Rを使用した統計分析のハンドブック。第13章主成分分析: R言語でPCAを実行する方法に関するオリンピック7大会。図13.3の解釈がわかりません。 したがって、最初の固有ベクトルと2番目の固有ベクトルをプロットしています。どういう意味ですか?最初の固有ベクトルに対応する固有値がデータセットの変動の60%を説明し、2番目の固有値-固有ベクトルが変動の20%を説明するとします。これらを互いにプロットすることはどういう意味ですか?

1
2Dコレスポンデンス分析プロットの解釈
私はインターネットを広く検索してきました... 2Dコレスポンデンス分析プロットを解釈する方法の本当に良い概要をまだ見つけていません。誰かがポイント間の距離を解釈する上でアドバイスを提供できますか? おそらく例が役立つでしょう。ここに、私が見た多くのウェブサイトで見つかった、コレスポンデンス分析についてのプロットがあります。赤い三角形は目の色を表し、黒い点は髪の色を表します。 上記のグラフを見て、これらのデータに表示されるものについていくつかのステートメントを作成できますか。三角形とドットの異なる次元と関係についての関心のある点は? 行ポイントと列ポイントの説明、および例に特に焦点を当てた「プロファイル」という言葉の使用は、役に立つでしょう。

1
PCAバイプロット上の矢印の配置
JavaScriptで主成分分析(PCA)のバイプロットを実装したいと考えています。私の質問は、データ行列の特異ベクトル分解(SVD)の出力から矢印の座標をどのように決定するのですか?U,V,DU,V,DU,V,D Rが生成するバイプロットの例を次に示します。 biplot(prcomp(iris[,1:4])) 私はそれを見上げてみましたバイプロット上のWikipediaの記事が、それは非常に便利ではありません。または修正します。どっちがわからない。
18 pca  svd  biplot 


1
変数とPCAコンポーネント(バイプロット/ローディングプロット上)との適切な関連付けの尺度は何ですか?
私はFactoMineR、測定値のデータセットを潜在変数に減らすために使用しています。 上記の変数のマップは私が解釈するのは明らかであるが、それは、変数マップを見て、変数と部品1の間の関連付けに来るとき、私は混乱しています、ddpとcov非常に近いマップ内のコンポーネントにある、とddpAbs少し遠いです離れて。しかし、これは相関関係が示すものではありません: $Dim.1 $Dim.1$quanti correlation p.value jittAbs 0.9388158 1.166116e-11 rpvi 0.9388158 1.166116e-11 sd 0.9359214 1.912641e-11 ddpAbs 0.9327135 3.224252e-11 rapAbs 0.9327135 3.224252e-11 ppq5 0.9319101 3.660014e-11 ppq5Abs 0.9247266 1.066303e-10 cov 0.9150209 3.865897e-10 npvi 0.8853941 9.005243e-09 ddp 0.8554260 1.002460e-07 rap 0.8554260 1.002460e-07 jitt 0.8181207 1.042053e-06 cov5_x 0.6596751 4.533596e-04 ps13_20 -0.4593369 2.394361e-02 ps5_12 -0.5237125 …

1
PCAバイプロットの矢印はどういう意味ですか?
次のPCAバイプロットを検討してください。 library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) たくさんの赤い矢印がプロットされていますが、それらはどういう意味ですか?「Var1」というラベルの付いた最初の矢印は、データセットの最もさまざまな方向を指している必要があることを知っていました(それらをそれぞれサイズ6のベクトルである2000データポイントと考える場合)。また、私はどこかから読んだ、最も変化する方向は、最初の固有ベクトルの方向でなければなりません。 ただし、Rのバイプロットのコードを読み取ります。矢印に関する行は次のとおりです。 if(var.axes) arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L], y固有ベクトル行列である実際の負荷行列はどこにありますか。したがって、最初の矢印が実際にから(0, 0)を指しているように見え(y[1, 1], y[1, 2])ます。高次元の矢印を2D平面にプロットしようとしていることを理解しています。これが、y[1, ]ベクトルの1番目と2番目の要素を取得する理由です。しかし、私が理解していないのは: 最初の固有ベクトルの方向は、y[, 1]ではなくで示されるベクトルではありy[1, ]ませんか?(これもyPCAまたはt(x) %*% x。の固有分解によって得られる固有ベクトル行列です。)固有ベクトルは、水平ベクトルではなく列ベクトルでなければなりません。 我々は2次元平面上にプロットされているにもかかわらず、我々からする第一の方向を描画する(0, 0)を指して(y[1, 1], y[2, 1])?
14 r  pca  linear-algebra  biplot 

1
PCAとPLSの「読み込み」と「相関読み込み」の違いは何ですか?
主成分分析(PCA)を実行するときに行う一般的なことの1つは、2つの負荷を互いにプロットして、変数間の関係を調べることです。主成分回帰とPLS回帰を行うためのPLS Rパッケージに付属するペーパーには、相関負荷プロットと呼ばれる別のプロットがあります(ペーパーの図7および15ページを参照)。相関負荷は、それが説明するように、(PCAからまたはPLS)スコアとの相関関係と実際の観測データです。 ローディングと相関ローディングは、スケーリングが少し異なることを除いて、かなり似ているように思えます。組み込みのデータセットmtcarsを使用したRでの再現可能な例は次のとおりです。 data(mtcars) pca <- prcomp(mtcars, center=TRUE, scale=TRUE) #loading plot plot(pca$rotation[,1], pca$rotation[,2], xlim=c(-1,1), ylim=c(-1,1), main='Loadings for PC1 vs. PC2') #correlation loading plot correlationloadings <- cor(mtcars, pca$x) plot(correlationloadings[,1], correlationloadings[,2], xlim=c(-1,1), ylim=c(-1,1), main='Correlation Loadings for PC1 vs. PC2') これらのプロットの解釈の違いは何ですか?そして、(もしあれば)実際に使用するのに最適なプロットはどれですか?

1
RのPCAバイプロットの基礎となる変数の矢印
質問をソフトウェア固有のものにするリスクがあり、その遍在性と特異性を言い訳にしてbiplot()、R の関数について、より具体的には、対応するデフォルトの重ねられた赤い矢印の計算とプロットについて質問したいと思います。基になる変数に。 [コメントの一部を理解するために、最初に投稿されたプロットには希少な問題があり、現在は消去されています。]
11 r  pca  biplot 

3
線形判別分析(LDA)のスケーリング値を使用して、線形判別式に説明変数をプロットできますか?
主成分分析で得られた値のバイプロットを使用して、各主成分を構成する説明変数を調べることができます。 これは線形判別分析でも可能ですか? 提供されている例では、データは「エドガーアンダーソンのアイリスデータ」(http://en.wikipedia.org/wiki/Iris_flower_data_set)です。ここで、虹彩データ: id SLength SWidth PLength PWidth species 1 5.1 3.5 1.4 .2 setosa 2 4.9 3.0 1.4 .2 setosa 3 4.7 3.2 1.3 .2 setosa 4 4.6 3.1 1.5 .2 setosa 5 5.0 3.6 1.4 .2 setosa 6 5.4 3.9 1.7 .4 setosa 7 4.6 3.4 1.4 .3 …

1
人々が興味を持っている分野の調査から得られたこのPCAバイプロットをどのように解釈するのですか?
背景:調査の何百人もの参加者に、選択した領域にどれだけ関心があるかを尋ねました(5ポイントのリッカートスケールで、1は「関心がない」、5は「関心がある」を示しています)。 その後、PCAを試しました。以下の図は、最初の2つの主成分への投影です。色は性別に使用され、PCA矢印は元の変数(つまり、関心)です。 きがついた: ドット(回答者)は、2番目のコンポーネントによって非常によく分離されています。 左向きの矢印はありません。 一部の矢印は他の矢印よりもはるかに短いです。 変数はクラスターを作る傾向がありますが、観測はしません。 下向きの矢印は主に男性の興味であり、上向きの矢印は主に女性の興味であるようです。 一部の矢印は下向きでも上向きでもありません。 質問:ドット(回答者)、色(性別)、矢印(変数)の関係を正しく解釈するにはどうすればよいですか?このプロットから、回答者とその関心について、他にどのような結論を導き出すことができますか? データはここにあります。

1
データ空間、変数空間、観測空間、モデル空間(例:線形回帰)
我々はデータ行列があるとであり、N行列P、およびラベルベクトルYであり、nは -by-一つ。ここで、行列の各行は観測値であり、各列は次元/変数に対応しています。(n > pと仮定)バツX\mathbf{X}んnnpppYYYんnnn>pn>pn>p 次に何をすべきかdata space、variable space、observation space、model space意味ですか? 列ベクトルにまたがる空間は、ランクpでありながらn座標を持っているため、(退化した) -D空間であり、変数ベクトルにまたがるため、可変空間と呼ばれますか?それとも、各次元/座標が観測に対応するため、観測空間と呼ばれますか?nnnnnnppp そして、行ベクトルがまたがる空間はどうですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.