チートシートANOVAアルファベットのスープと回帰の同等物


18

この暫定的な(進行中の)試みをANOVAおよび回帰に相当するものにしようとする試みを完了するのを手伝ってもらえますか?私はこれら2つの方法論の概念、命名法、構文を調和させようと試みてきました。このサイトには、その共通性に関する多くの投稿があります。たとえばthisまたはthisです。しかし、開始時に簡単な "you are here"マップを用意しておくとよいでしょう。

私はこの投稿を更新する予定であり、間違いを修正するのに役立つことを望んでいます。

一元配置分散分析:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

二元配置分散分析:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

二元要因分散分析:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

アンコバ:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

マノバ:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

マンコバ:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

FACTOR(またはSUBJECT)ANOVA WITHIN: ここではコード

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ここではコード

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

NESTED DESIGN: ここではコード

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

便利なサイト:

  1. RExRepos
  2. 人格プロジェクト
  3. クイックR
  4. R-ブロガー
  5. M.クローリーによるネストされた分析と分割プロット
  6. 複数のランダム効果を持つモデル
  7. 分割プロットモデル
  8. M.クローリーのRブック
  9. グループ内および反復測定内
  10. Rでメジャーを繰り返します
  11. GLMM FAQ

1つの注:2-way ANOVAの例(直線的および階乗)のシナリオ/構文はcyl + hpです。Horespowerは継続的であるため、ここでは機能しません。carb、キャブレターの数はより良い選択です。
グレゴール

ありがとうございました!不注意な間違い。あなたのメモのおかげで、cylが連続として扱われていることも検出したので、as.factorに変更しました。そして、TukeyHSDを含めました。
アントニ・パレラダ

1
タイトルから「サバイバル」を削除すべきだと思います。それは、あなたが(非常にうまく)要約しているものとはまったく関係のない統計の非常に具体的な領域だからです。
ブライアンハンソン

素敵な要約アントニ!たぶん、あなたはまた、追加することができglmmFAQsベンBolkerによると、おそらくいくつかの単純な二項及びポアソン例(GLMとGLMMを)。しかし、これは物事を複雑にしすぎる可能性があり、この素晴らしく簡潔な要約から離れることを理解しています。または、このサイトの例にリンクできます。完全な単純なポアソン/負の二項の例では、これは機能する可能性があります:stats.stackexchange.com/questions/325334/…–
Stefan

回答:


2

素敵なリスト、アントニ。次に、いくつかの小さな提案を示します。

一元配置分散分析:IVは、3つ以上のレベルを持つ因子です。このエントリにサンプルデータ:mtcarsを追加することもできます。(同様に、使用するデータセットを明確にするために、すべてのエントリに* Example Data "ステートメントを追加できます。)

Two-Way Anova:IV1とIV2を使用して、2つの独立変数がそれぞれ少なくとも2つのレベルを持つ因子であるべきだと述べるのはなぜですか?あなたがこれを述べている方法は、現在、双方向anovaが2つ以上の独立変数(または因子)を含むことができることを示唆していますが、これは無意味です。

Two-Way Anovaの場合、これら2つのサブケースを区別します。1。IV1とIV2の主な効果を持つ2方向Anovaと2. IV1とIV2の相互作用を伴う2方向Anova。この2番目の項目は、2つを階乗の2方向分散として参照するものです。)これらの2つのサブケースを説明するより良い方法は、次のとおりです。 DVの場合はIV2に依存します。また、回帰設定でダミーコード化されているのは独立変数IV1およびIV2であることを明確にすることもできます。

ANCOVAの場合、現在の例では一方向のANCOVAのみを検討していることを明確にすることができます。完全を期すために、IV1とIV2の間に相互作用のない双方向ANCOVAの例を追加し、これら2つの変数間の相互作用のある例を追加できます。

上記のすべてについて、これらの分析がいつ役に立つかを説明するPurposeという項目を追加することもできます。例えば:

(一方向分散の)目的:DVの平均値がIVのレベル間で異なるかどうかを調査します。

MANOVAの場合、(a)2つ以上のDVと(2)要因である1つ以上のIVが必要であることを明確にできますか?一元配置のMANOVA(1因子)と双方向のMANOVAを区別できると思いますか?マンコバにも同じことが言えます。

WITHIN-FACTOR ANOVAは反復測定ANOVAとしても知られているため、この用語をリストに追加して、それに精通している人向けに使用できます。混合効果モデリングは、反復測定データのモデリングに代わる方法を提供することを明確にすることも役立ちます。そうしないと、読者は2つのアプローチの違いを理解できないかもしれません。


私は提案ではなく、メイクedits.🤗提供するのは簡単だ
イザベラGhement
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.