教えるための良いPCAの例


10

私はエンジニア、社会科学者、コンピュータープログラマーのクラスに線形代数を教えています。特異値分解を行ったばかりで、あと1日残っているので、特異値分解と主成分分析の関係について話そうと思いました。私は講義の理論の部分をうまく書いていますが、使用する良い例を見つけるのに苦労しています。ここに制約があります:

  • 写真を見せたいです。理想的には、グラフィックス自体がうまく機能する必要があります。散布図の軸とデータポイントにラベルを付ける必要があります。英語の単語はラテン語の種名よりも優れています。

  • 調査中の質問は興味深いはずです。ナイジェリアの魚の形態は重要ですが、クラスの注意を引くには良い方法ではありません。

  • 前の箇条書きとは対照的に、人種の違いについては何もありません。知能テストについては何もありません。それは数学的手法とは何の関係もない活発な議論につながるでしょう。

  • 数学的分析方法は、基本的に純粋なPCAである必要があります。DW-NOMINATEプロジェクトは素晴らしいものですが、PCAを開始点として使用し、その後にはるかに複雑な山登りアルゴリズムが続きます。

これは簡単だと思います。データを収集する時間があれば、私ができる12の楽しい分析プロジェクトを簡単に思いつくことができます。典型的な犬の品種の物理的特性を数十回測定し、PCAが「羊犬」のクラスターを見つけられるかどうかを確認します。Etcetera、etcetera ...私はそれを誇示できるように、すでに仕事をした人を探しています。

ここのタイムラインはかなりタイトだと思います。明日の午後(月曜日)に講義します。私は週末のほとんどをPCAのさまざまな興味深い分野での調査に費やし、それらが適切でないことを何度も繰り返し発見しました。


1
ナイジェリアの魚の形態は、私の注意を引くのに十分です(私は生物学者ではありません)。私が珍しいのか、あなたが物事に興味を持つ人々の能力を過小評価しているのかはわかりません。多分それはそれぞれの少しです。
Glen_b-2013

1
@Glen_bここでscielo.cl/pdf/ijmorphol/v29n4/art60.pdfに移動します
David E Speyer

回答:


4

Shaliziのノートのいくつかのステップバイステップガイドがここにありますhttp://www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch18.pdf、Rおよび他のビーイングから設定一つである自動車用のデータは、ニューヨークタイムズからの芸術と音楽の記事。(記事に含まれる単語から記事のトピックを推測することは、非常に活発な研究分野です。)Rを知らない、またはRを学びたくない場合でも、彼のメモとグラフィックを使用できます。

編集:エバーニットとホットホーンの本には、SpringerLinkで入手できるいくつかの良い例があることを忘れていました。私が覚えているように、1つのデータセットはジェット戦闘機であり、ローマの陶器もあります。


2

あなたの講義には遅すぎることは承知していますが、ここでは、PCAを学習するときに非常に役立つとわかったオリンピックの十種競技データを使用した例を示します。Rベースの2つの記事:http : //factominer.free.fr/classical-methods/principal-components-analysis.html http://www.math.vu.nl/sto/onderwijs/multivar/ College2.pdf


上記のリンクはどれも機能しなくなったため、これに代わるものを次に示し
〜jtaylo
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.