100万のPCAエディションを視覚化する


31

主成分分析の出力を、単なるサマリーテーブルよりも多くの洞察を与える方法で視覚化することは可能ですか?〜1e4など、観測数が多い場合に実行できますか?そして、R [他の環境も歓迎]でそれを行うことは可能ですか?


2
いくつかの質問:コンポーネントはいくつありますか?サンプルサイズのほかに、このPCA出力の表示を、他の連続変数の表示とは異なるものにする必要があるのでしょうか?異なるグループのスコアを比較しようとしていますか?一般的に、ディスプレイで何を達成したいですか?
rolando2

回答:


53

バイプロットは、 PCAの結果を可視化するための便利なツールです。主成分スコアと方向を同時に視覚化できます。10,000回の観測では、おそらくオーバープロットの問題が発生します。そこでアルファブレンディングが役立ちます。

UCI MLリポジトリからのワインデータの PCバイプロットです

UCI MLリポジトリからのワインデータのPCビプロット

ポイントは、各観測のPC1およびPC2スコアに対応します。矢印は、変数とPC1およびPC2との相関関係を表しています。白い円は、矢印の理論上の最大範囲を示しています。楕円は、データ内の3つのワイン品種それぞれの68%のデータ楕円です。

このプロットを生成するためコードをここで利用可能にしました


5
本当にダイナマイトの追加。
rolando2

1

p×2VVVT

V

4

Wachterプロットは、PCAの固有値を視覚化するのに役立ちます。これは、本質的に、マルチェンコパスツール分布に対する固有値のQQプロットです。ここに例を示します:単一の支配的な固有値を示すWachterプロットマルケンコパステル分布の外にある1つの支配的な固有値があります。この種のプロットの有用性は、アプリケーションによって異なります。


7
ここで詳細を知ると役立つでしょう(おそらく、追加の説明や有用なリンクがいくつかあります)。Marchenko-Pasturディストリビューションとは何ですか?PCAとどのように関係していますか?結果が成り立つか、成り立たない場合、結果にとって何を意味しますか?(etc)
gung-モニカの復職

0

psychパッケージも使用できます。

これにはplot.factorメソッドが含まれています。このメソッドは、散布図マトリックスのスタイルで異なるコンポーネントを互いにプロットします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.