ANOVAとは何かを視覚的に説明する方法(方法)
参照、リンク(Rパッケージ?)は歓迎されます。
ANOVAとは何かを視覚的に説明する方法(方法)
参照、リンク(Rパッケージ?)は歓迎されます。
回答:
個人的には、線形回帰とANOVAを導入するのが好きです。それはすべて同じであり、線形モデルが合計分散を分割することを示すことです。一部(「残余」と呼ばれる)。私は通常、次の図を使用します(全体の変動性の灰色の線、グループまたは個々の特定の変動性の黒い線):
Michael FriendlyとJohn Fox のheplots Rパッケージも気に入っていますが、多変量線形モデルの視覚仮説検定:Rのheplotsパッケージも参照してください。
特に線形モデルフレームワークでANOVAが実際に行うことを説明する標準的な方法は、Christensenによる複雑な質問に対する平面の回答で非常によく説明されていますが、図はほとんどありません。Saville and Woodの統計的手法:幾何学的アプローチにはいくつかの例がありますが、主に回帰に関するものです。主にDoEに焦点を当てたMontgomeryのDesign and Analysis of Experimentsには、好きなイラストがありますが、以下を参照してください
(これらは私のものです:-)
しかし、Wikipediaに示されているように、二乗和や誤差などがベクトル空間にどのように変換されるかを知りたい場合は、線形モデルで教科書を探す必要があると思います。DavidsonとMacKinnonによるEconometricsの推定と推論は、素晴らしいイラストを持っているようです(第1章では実際にOLSジオメトリを扱います)が、フランス語の翻訳(ここで入手可能)のみを参照します。線形回帰の幾何学にもいくつかの良い例があります。
編集:
ああ、私はロバート・プルゼクによる、一元配置分散分析の新しいグラフィックのこの記事を覚えています。
編集2
そして今、granovaのパッケージ(@のgd047言及及び上記論文に関連する)はggplotに移植された、参照granovaGGを以下一方向ANOVAするための説明図です。
これまでの素晴らしい回答をありがとう。彼らは非常に啓発的でしたが、私が現在教えているコース(まあ、TA'ing)でそれらを使用することは私の学生にとっては多すぎると感じました。(医学の高度な学位の学生向けにBioStatisticsコースを教えるのを手伝います)
したがって、ANOVAを説明するのに役立つ例だと思う2つの画像(両方ともシミュレーションベース)を作成することになりました。
それらを改善するためのコメントや提案をお読みください。
最初の画像は、3つのプロットに分離された30個のデータポイントのシミュレーションを示しています(MSBとMSWを作成するデータにMST = Varがどのように分離されているかを示します。
2番目の画像は4つのプロットを示しており、それぞれがグループの分散と期待値の異なる組み合わせを示しています。
ggplotに関するHadley Wickhamのプレゼンテーション(pdf、mirror)をご覧ください。このドキュメントの23〜40ページから、彼はANOVAを視覚化する興味深いアプローチについて説明しています。
* http://had.co.nz/ggplot2/からのリンク
いい質問ですね。ご存知のように、私は非常に長い間、ANOVAに頭を包むことに苦労してきました。私はいつも「間対内」の直感に戻っていることに気付き、これが私の頭の中でどのように見えるかを常に想像しようとしました。この質問が出てきてうれしく思います。また、上記の回答でこれに対するさまざまなアプローチに驚かされました。
とにかく、長い間(何年も)、私は多くの異なる方向から同時に何が起こっているかを見ることができる1つの場所にいくつかのプロットを集めたいと思っていました:1)人口がどれくらい離れているか、2)どのようにデータが大きく離れている、3)内と比較して、その間の大きさ、および4)中央と非中央の F分布をどのように比較しますか?
本当に素晴らしい世界では、スライダーを使って、サンプルサイズが物事をどのように変えるかを見ることができました。
だから私はRStudioのmanipulate
コマンドで遊んでいます、そして聖なる牛、それは動作します!プロットの1つであるスナップショットを実際に示します。
RStudioをお持ちの場合、上記のプロット(スライダーとすべて)を作成するためのコードを入手できます!Githubでこちら。
しばらくこれを試した後、適度に小さいサンプルサイズであっても、F統計量がグループをどれだけうまく区別しているかに驚かされます。人口を見ると、実際にはそれほど離れていません(私の目には)が、「内」のバーは「間」のバーによって一貫して小さくなっています。毎日何かを学ぶと思います。
回答の観点から船はすでに航海しているようですが、これが入門コースである場合、ここで提供されるディスプレイのほとんどは入門学生にとって把握するのが難しすぎると思います...または少なくともパーティション化分散の非常に単純化された説明を提供する紹介ディスプレイなしでは把握が困難です。被験者の数とともにSST合計がどのように増加するかを示します。その後、複数の被験者に対して膨張することを示した後(各グループに1回追加する場合があります)、SST = SSB + SSWであることを説明します(ただし、被験者内でIMOをテストする際に混乱を避けるため、最初からSSEと呼びます) )。次に、分散パーティションの視覚的表現、たとえば、SSTがSSBとSSWでどのように作成されているかを確認できるようにコード化された大きな正方形を表示します。その後、