ANOVAはどのような質問に答えますか?


9

分散分析を学びたいです。アルゴリズムのしくみ(どのような計算を行う必要があるか)とその理由を学ぶ前に、まずANOVAで実際に解決する問題、または回答しようとする答えを知りたいと思います。言い換えると、アルゴリズムの入力と出力は何ですか?

入力として何を使用するか理解しています。数字のセットがあります。各数値には、1つ以上のカテゴリ変数(「因子」とも呼ばれます)の値が付属しています。例えば:

+------------+------------+-------+
|   factor 1 |   factor 2 | value |
+------------+------------+-------+
|     "A"    |     "a"    |  1.0  |
|     "A"    |     "a"    |  2.4  |
|     "A"    |     "b"    |  0.3  |
|     "A"    |     "b"    |  7.4  |
|     "B"    |     "a"    |  1.2  |
|     "B"    |     "a"    |  8.4  |
|     "B"    |     "b"    |  0.4  |
|     "B"    |     "b"    |  7.2  |
+------------+------------+-------+

ANOVAは、値の平均に対する因子の影響がないことを示す帰無仮説のp値を計算すると言っても正しいですか?つまり、上記のデータをアルゴリズムに与え、結果として帰無仮説のp値を取得しますか?

その場合、p値を計算するために実際に使用する指標は何ですか。たとえば、帰無仮説Mが1%のケースで偶然に観測されたものと同じかそれ以上(またはそれ以上)になる可能性があると言えます。Mとは?

分散分析の因子も個別に調査しませんか?ANOVAは、factor_1には効果があるが、factor_2には効果がないと言えますか?ANOVAは、値「A」、「B」、および「C」に対応する特定の因子の値は統計的に区別できない(たとえば、同じ意味を持つ)が、値「D」は効果があると言えるでしょうか?

回答:


6

ANOVAは「分散分析」の略です。当然のことながら、分散を分析します。

もう少し明確にしましょう。あなたの観察は、いくらかの差異を示します。観測値を因子1でグループ化すると、因子1で定義されたグループ内の分散は、全体の分散よりも小さくなります。因子1は「差異を説明する」。

F

FFFpF

(なぜ片側検定ですか?上記のように、任意のグループ化はいくつかの分散を説明するので、因子が非常に大きな量の分散を説明するかどうかを確認することは意味があります。)

ウィキペディアエントリ「やる気を起こさせる例」セクションでは、全体的な差異のほとんど、一部、および多くを説明する要因の非常に優れた図を提供しています。

あなたの例のように、二元配置分散分析と相互作用、そしてANCOVAは、このテーマの単なる一般化です。いずれの場合も、いくつかの説明変数を追加することで、非常に大きな差異が説明されるかどうかを調査します。

Ft


VviM=M(V,v1,v2,...,vk,n1,n2,...,nk)。次に、帰無仮説が正しいと仮定して、Mがそれと同じかそれ以上になる確率を計算します。
ローマ

MF

正直なところ、私はまだ少し混乱しています。私が入手した限りでは、ANOVAは帰無仮説のp値を返します。しかし、その一方で、ウィキペディアの「やる気を起こさせる例」から、ANOVAが私たちに最良の因子(または因子の組み合わせ)を与え、データを最もよく説明するという結論を出すことができます。したがって、例では、ANOVAは犬の体重を説明するのに品種が最良の要素であると述べています。
ローマ

1
F
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.