PCAの目的は次元を減らすことであることを知っています
これは、多くの場合、人々が想定していることですが、実際、PCAは、データを直交的に表現したものにすぎません。この基底は、元のデータと同じ次元を持っています。何も失われていません...まだ。次元削減の部分は完全にあなた次第です。PCAが保証するのは、新しい投影法の上位次元が、データが表現される可能性のある最良の次元であることです。どういう意味ですか?ここで、説明された差異が発生します。kk k
明らかにこの場合ではありません
私はそれについてそれほど確信していません!2番目のプロットから、視覚的には、データからの多くの情報を水平線に投影できるように見えます。2次元の元のプロットではなく、1次元です。Y軸を削除しているため、明らかに一部の情報が失われますが、この情報の損失が許容できるかどうかは、あなたの責任です。
私はそれらをチェックアウトすることをお勧めしますので、PCAは、サイト上にあるものに関連する質問のトンがあり、ここで、ここでは、ここやここで。その後、他にご不明な点がありましたら、投稿してください。サポートさせていただきます。
あなたの実際の質問として:
PCAプロットの温度とアイスクリームについて語れるストーリーは何ですか?
新しい座標軸は元の座標の線形結合なので、基本的には何もありません!PCAは、次のような回答を提供します(数字の構成):
PC1PC2=2.5×ice cream−3.6×temperature=−1.5×ice cream+0.6×temperature
役に立ちましたか?多分。しかし、私はそうは思いません:)
編集済み
このリソースを追加します。インタラクティブなグラフはすばらしいので、役立つと思います。
再度編集
最適な 意味を明確にするには:k
PCAは、データが射影されたときに分散が最大になる次元を見つけようとします。データの次元がとすると、最初の PCは、他の次元よりも多くのデータの分散を説明します。それが私が最高の意味していることです。それがあなたに役立つかどうかは別問題です。k k kn>kkk k