ANOVAの機能を視覚化する方法は?


60

ANOVAとは何かを視覚的に説明する方法(方法)

参照、リンク(Rパッケージ?)は歓迎されます。


彼のブログ「心理学者の統計プログラミングの取り組み」で、Kristoffer Magnussonは、D3.js rpsychologist.com/d3-one-way-anova/#comment-1891
Epifunky

私は、分散分析とは何かというこの素晴らしい視覚化を見つけました。以前の回答ほど正確ではありませんが、視覚化をインタラクティブに操作できます。:それはかなりのintersting見つかりstudents.brown.edu/seeing-theory/regression/index.html#third
マイク・

回答:


51

個人的には、線形回帰とANOVAを導入するのが好きです。それはすべて同じであり、線形モデルが合計分散を分割することを示すことです。一部(「残余」と呼ばれる)。私は通常、次の図を使用します(全体の変動性の灰色の線、グループまたは個々の特定の変動性の黒い線):

代替テキスト

Michael FriendlyとJohn Fox のheplots Rパッケージも気に入っていますが、多変量線形モデルの視覚仮説検定:Rのheplotsパッケージも参照してください。

特に線形モデルフレームワークでANOVAが実際に行うことを説明する標準的な方法は、Christensenによる複雑な質問に対する平面の回答で非常によく説明されていますが、図はほとんどありません。Saville and Woodの統計的手法:幾何学的アプローチにはいくつかの例がありますが、主に回帰に関するものです。主にDoEに焦点を当てたMontgomeryのDesign and Analysis of Experimentsには、好きなイラストがありますが、以下を参照してください

代替テキスト

(これらは私のものです:-)

しかし、Wikipediaに示されているように、二乗和や誤差などがベクトル空間にどのように変換されるかを知りたい場合は、線形モデルで教科書を探す必要があると思います。DavidsonとMacKinnonによるEconometricsの推定と推論は、素晴らしいイラストを持っているようです(第1章では実際にOLSジオメトリを扱います)が、フランス語の翻訳(ここで入手可能)のみを参照します。線形回帰の幾何学にもいくつかの良い例があります。

編集

ああ、私はロバート・プルゼクによる、一元配置分散分析の新しいグラフィックのこの記事を覚えています。

編集2

そして今、granovaのパッケージ(@のgd047言及及び上記論文に関連する)はggplotに移植された、参照granovaGGを以下一方向ANOVAするための説明図です。

ここに画像の説明を入力してください


最初のイラストはRを使用して作成されていますか?
ジョージドンタス

@ gd047はい。必要に応じて、いソースコードをどこかに置く必要があります。2つ目はMetapostで行われます。
chl

3
@ gd047大丈夫、いつものように、(grep / findでの最善の努力にも関わらず)見つけられない古いコードを探すときは常にそうなので、私はそのための迅速な(まだい)Rスクリプトを書き直しました。MPコードの例も載せました。
CHL

残念ながら、線形回帰リンクのジオメトリは腐敗しているようです。
シルバーフィッシュ

23

このようなものはどうですか? 代替テキスト

クローリー(2005)に続く。統計。Rを使用した紹介:Wiley。


1
(+1)を思い出させますplot.design()(ただし、拡張版ではあなたのものです:
chl

これが一番。
好奇心が

13

これまでの素晴らしい回答をありがとう。彼らは非常に啓発的でしたが、私が現在教えているコース(まあ、TA'ing)でそれらを使用することは私の学生にとっては多すぎると感じました。(医学の高度な学位の学生向けにBioStatisticsコースを教えるのを手伝います)

したがって、ANOVAを説明するのに役立つ例だと思う2つの画像(両方ともシミュレーションベース)を作成することになりました。

それらを改善するためのコメントや提案をお読みください。

最初の画像は、3つのプロットに分離された30個のデータポイントのシミュレーションを示しています(MSBとMSWを作成するデータにMST = Varがどのように分離されているかを示します。

  • 左側のプロットは、グループごとのデータの散布図を示しています。
  • 中央のものは、MSBに使用するデータがどのように見えるかを示しています。
  • 右の画像は、MSWに使用するデータがどのように見えるかを示しています。

代替テキスト

2番目の画像は4つのプロットを示しており、それぞれがグループの分散と期待値の異なる組み合わせを示しています。

  • プロットの最初の行は低分散用であり、2番目の行は高分散用です。
  • プロットの最初の列はグループ間の期待値が等しいことを示し、2番目の列は(非常に)異なる期待値を持つグループを示しています。

代替テキスト


2
H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0)。これらのアイデアをグラフィカルなディスプレイに伝えることができれば(ここではそうかもしれませんが)、ほぼ完了です。
CHL

こんにちはchl、正のフィードバック(および以前の詳細な回答)に感謝します!このクラスの資料を準備することで得た最大のマッサージは次のとおりです。1)元のデータの変換を記述してMSBおよびMSWの分散測定値を取得する方法。2)MSB / MSWの検定統計量は、H0がMSB <= MSWである場合、実際には片側(両側ではなく)の検定です。最後に、SSW = SST-SSBであることが真実であることに注意したいと思いました(しかし、MSW = MST-MSBでどのように真実であるかはわかりません)。
タルガリリ

1
yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)

12

この投稿では特定の種類の素敵なグラフを収集しているので、最近見つけた別のグラフを紹介します。ANOVAの仕組みとF統計の生成方法を理解するのに役立ちます。グラフィックは、Rのgranovaパッケージを使用して作成されました。 代替テキスト


2
(+1)ロバートプルゼクの記事へのリンクを提供しましたが、Rで利用できることを知りませんでした。
chl

10

ggplotに関するHadley Wickhamのプレゼンテーション(pdfmirror)をご覧ください。このドキュメントの23〜40ページから、彼はANOVAを視覚化する興味深いアプローチについて説明しています。

* http://had.co.nz/ggplot2/からのリンク


6

いい質問ですね。ご存知のように、私は非常に長い間、ANOVAに頭を包むことに苦労してきました。私はいつも「間対内」の直感に戻っていることに気付き、これが私の頭の中でどのように見えるかを常に想像しようとしました。この質問が出てきてうれしく思います。また、上記の回答でこれに対するさまざまなアプローチに驚かされました。

とにかく、長い間(何年も)、私は多くの異なる方向から同時に何が起こっているかを見ることができる1つの場所にいくつかのプロットを集めたいと思っていました:1)人口がどれくらい離れているか、2)どのようにデータが大きく離れいる、3)と比較して、その間の大きさ、および4)中央中央の F分布をどのように比較しますか?

本当に素晴らしい世界では、スライダーを使って、サンプルサイズが物事をどのように変えるかを見ることができました。

だから私はRStudiomanipulateコマンドで遊んでいます、そして聖なる牛、それは動作します!プロットの1つであるスナップショットを実際に示します。

視覚化ANOVA

RStudioをお持ちの場合、上記のプロット(スライダーとすべて)を作成するためのコードを入手できます!Githubでこちら

しばらくこれを試した後、適度に小さいサンプルサイズであっても、F統計量がグループをどれだけうまく区別しているかに驚かされます。人口を見ると、実際にはそれほど離れていません(私の目には)が、「内」のバーは「間」のバーによって一貫して小さくなっています。毎日何かを学ぶと思います。


3

一元配置分散分析で何が起こっているかを説明するために、「統計の実践入門」の著者が提供するアプレットを使用したことがあります。 。ここにリンクは(アプレットがページの最後の1である)です。サンプルスクリーンショット:

ここに画像の説明を入力してください

ユーザーは上部のスライダーを制御して、3つのデータグループの垂直方向の広がりを変化させます。下に表示されているF統計が更新されている間、下部の赤い点はp値のプロットに沿って移動します。


2

回答の観点から船はすでに航海しているようですが、これが入門コースである場合、ここで提供されるディスプレイのほとんどは入門学生にとって把握するのが難しすぎると思います...または少なくともパーティション化分散の非常に単純化された説明を提供する紹介ディスプレイなしでは把握が困難です。被験者の数とともにSST合計がどのように増加するかを示します。その後、複数の被験者に対して膨張することを示した後(各グループに1回追加する場合があります)、SST = SSB + SSWであることを説明します(ただし、被験者内でIMOをテストする際に混乱を避けるため、最初からSSEと呼びます) )。次に、分散パーティションの視覚的表現、たとえば、SSTがSSBとSSWでどのように作成されているかを確認できるようにコード化された大きな正方形を表示します。その後、


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.