タグ付けされた質問 「anova」

ANOVAは、複数のグループ平均を比較するための統計モデルおよび一連の手順であるVArianceのANalysisの略です。ANOVAモデルの独立変数はカテゴリカルですが、ANOVAテーブルを使用して連続変数をテストすることもできます。

2
Rの正規性または分散の等値性のないデータで双方向ANOVAを実行する方法は?
現在、修士論文に取り組んでおり、SigmaPlotで統計を実行することを計画しています。しかし、データにしばらく時間を費やした後、SigmaPlotが問題に合わない可能性がある(間違っている可能性がある)という結論に達しました。 計画では、3つの異なるタンパク質とそれらの8つの異なる処理から得られる私のデータに対して単純な2因子分散分析を実行することでした。そのため、私の2つの要因はタンパク質と処理です。両方を使用して正常性をテストしました > shapiro.test(time) そして > ks.test(time, "norm", mean=mean(time), sd=sqrt(var(time))) どちらの場合も(驚くことではないかもしれませんが)、私は非正規分布になりました。 これにより、分散の等式に使用するテストの最初の質問が残りました。思いついた > chisq.test(time) その結果、データにも分散の等値性がありませんでした。 さまざまなデータ変換(ログ、中央、標準化)を試しましたが、それらはすべて分散の問題を解決しませんでした。 今、私は途方に暮れています。どのタンパク質とどの治療法が互いに有意に異なるかをテストするためにANOVAを実施する方法です。Kruskal-Walis-Testについて何かを見つけましたが、それは1つの要因(?)だけです。また、ランキングやランダム化についても発見しましたが、Rでそれらの手法を実装する方法はまだありません。 誰かが私がすべきことを提案していますか? 編集:あなたの答えに感謝します、私は読書に少し圧倒されます(それはちょうどより少なくよりむしろますます得ているようです)、しかし、私はもちろん続けます。 提案されたデータの例を次に示します(形式が非常に残念で、別の解決策やファイルを置く場所がわかりませんでした。私はまだこのすべてに慣れていません。): protein treatment time A con 2329.0 A HY 1072.0 A CL1 4435.0 A CL2 2971.0 A CL1-HY sim 823.5 A CL2-HY sim 491.5 A CL1+HY mix 2510.5 A CL2+HY mix …

4
ezANOVAでタイプIIIの平方和を要求する引数を含める必要がありますか?
Rのezパッケージは、SPSSのような統計パッケージからRへの移行を支援する手段として開発されました。これは、(願わくば)ANOVAのさまざまなフレーバーの仕様を単純化し、SPSSのような出力(エフェクトサイズと仮定を含む)テスト)、他の機能の中で。このezANOVA()関数は主にのラッパーとして機能しますcar::Anova()が、現在のバージョンでezANOVA()はタイプIIの平方和のみを実装していcar::Anova()ますが、タイプIIまたは-IIIの平方和を指定できます。おそらく予想していたはずですが、いくつかのユーザーは、ezANOVA()これにより、ユーザーはタイプIIまたはタイプIIIを要求できます。私はそうすることをticし、以下に自分の推論を概説しましたが、この問題に関係する自分自身またはその他の推論に関するコミュニティの意見に感謝します。 に「SS_type」引数を含めない理由ezANOVA(): タイプI、II、およびIIIの平方和の違いは、データが不均衡な場合にのみ生じます。この場合、ANOVA計算をいじるよりも、さらにデータを収集することで不均衡を改善することにより多くの利点が得られると思います。 タイプIIとタイプIIIの違いは、高次効果によって修飾される低次効果に適用されます。(ただし、引数の複雑化の可能性については以下を参照してください) (1)と(2)が当てはまらないまれな状況(これ以上のデータ収集が不可能であり、研究者が現在私が想像できない修飾された主効果に有効な科学的関心を持っている場合)ezANOVA()ソースまたは採用car::Anova()自体は、III型テストを達成します。このように、タイプIIIテストを取得するために必要な追加の努力/理解は、自分が何をしているかを本当に知っている人だけがそのルートに行くことを保証できる手段として見ています。 現在、最新のタイプIIIリクエスターは、現存するが「重要ではない」高次効果が低次効果の平方和の計算にバイアスをかけることができる状況を考慮すると、引数(2)が損なわれることを指摘しました。そのような場合、研究者が高次効果に目を向け、それが「重要ではない」ことを見て、研究者に知られていない低次効果の解釈を試みようとすることは想像できます。私の最初の反応は、これは二乗和の問題ではなく、p値と帰無仮説検定の伝統に関する問題です。尤度比などの証拠のより明示的な測定値は、データと一貫性のあるサポートされているモデルのあいまいさを軽減する可能性が高いと思われます。しかし、私はしていません

5
ANOVAの仮定の確認
数か月前に、SOのRでの同分散性テストに関する質問を投稿しましたが、Ian Fellowsが答えました(彼の答えは非常に大まかに言い換えます)。 モデルの適合度をテストするとき、同相性テストは良いツールではありません。小さなサンプルでは、​​ホモ分散性からの逸脱を検出するのに十分なパワーがありませんが、大きなサンプルでは「十分なパワー」があるため、平等からの些細な逸脱でもスクリーニングする可能性が高くなります。 彼の素晴らしい答えは私の顔に平手打ちとして来ました。以前は、ANOVAを実行するたびに、正規性と同分散性の仮定をチェックしていました。 あなたの意見では、ANOVAの仮定をチェックするときのベストプラクティスは何ですか?

3
Rのノンパラメトリック反復測定マルチウェイAnova
次の質問は、私にとってしばらくの間、これらの聖杯の一つです。誰かが良いアドバイスを提供できることを願っています。 Rを使用して、ノンパラメトリックの反復測定マルチウェイアノーバを実行したいと思います。 私はしばらくオンライン検索と読書を行ってきましたが、これまでは一部のケースのみの解決策を見つけることができました:一方向ノンパラメトリック反復測定アノーバのフリードマン検定、多元ノンパラメトリックの{car}アノーバ関数による順序回帰anovaなど。部分的な解決策は、この質問スレッドで私が探しているものではありません。私がこれまでに公開した投稿でこれまでの調査結果をまとめました(タイトル:反復測定ANOVA with R(関数とチュートリアル)、誰でも役立つ場合) オンラインで読んだ内容が正しい場合、このタスクは混合順序回帰モデル(別名:比例オッズモデル)を使用して達成できます。 関連性があると思われる2つのパッケージを見つけましたが、このテーマに関するビネットは見つかりませんでした。 http://cran.r-project.org/web/packages/repolr/ http://cran.r-project.org/web/packages/ordinal/ そのため、このテーマに慣れていない私は、ここの人々からの指示を期待していました。 このテーマに関するチュートリアル/推奨読書はありますか?さらに良いことに、Rでこれを実行および分析する方法の簡単なコード例を提案できます(例:「ノンパラメトリック反復測定multiway anova」)。

2
反復測定ANOVA:正規性の仮定とは何ですか?
反復測定ANOVAの正規性の仮定について混乱しています。具体的には、どのような正常性を正確に満たす必要があるのか​​と思っています。CVに関する文献と回答を読んで、この仮定の3つの明確な文言に出会いました。 各(繰り返し)条件内の従属変数は、正規分布する必要があります。 rANOVAにはANOVAと同じ仮定に加えて球形性があるとよく言われます。これは、FieldのDiscovering統計と、Wikipediaの主題とLowryのテキストに関する記事の主張です。 残差(考えられるすべてのペア間の差?)は正規分布である必要があります。 私は、CV(上の複数回答でこの文を見つけました1、2)。rANOVAと対になったt検定との類推により、これも直感的に見えるかもしれません。 多変量正規性を満たす必要があります。 ウィキペディアとこのソースはこれに言及しています。また、rANOVAはMANOVA と交換できることを知っています。これはこの主張に値するかもしれません。 これらは何とか同等ですか?私はそれをその多変量正規の手段を知っているすべての私が正しく、後者を理解している場合3.自然に2が含まれるので、のDVの線形結合が正常に配布されます。 これらが同じでない場合、rANOVAの「真の」仮定はどれですか。参照を提供できますか? 私には、最初の主張に対する支持がほとんどあるようです。ただし、これは通常ここで提供される回答と一致していません。 線形混合モデル @utobiのヒントにより、rANOVAを線形混合モデルとして再表現する方法を理解できました。具体的には、経時的モデル方法血圧変化に、私は期待値をモデル化することになる: Y 、I 、Jの血圧の測定値であるが、私の平均血i番目の被験者の圧力、およびi番目の被験者が測定されたj番目の時間としてのt i j、b iE[yij]=ai+bitij,E[yij]=ai+bitij, \mathrm{E}\left[y_{ij}\right]=a_{i}+b_i t_{ij}, yijyijy_{ij}aiaia_{i}iiitijtijt_{ij}jjjiiibibib_i血圧の変化も被験者間で異なることを示しています。被験者のサンプルは母集団のランダムなサブセットにすぎないため、両方の効果はランダムと見なされます。 最後に、私はこれが正常性にとって何を意味するか考えようとしましたが、ほとんど成功しませんでした。McCulloch and Searle(2001、p。35. Eq。(2.14))を言い換えると: E[yij|ai]yij|aiai=ai∼indep. N(ai,σ2)∼i.i.d. N(a,σ2a)E[yij|ai]=aiyij|ai∼indep. N(ai,σ2)ai∼i.i.d. N(a,σa2)\begin{align} \mathrm{E}\left[y_{ij}|a_i\right] &= a_i \\[5pt] y_{ij}|a_i &\sim \mathrm{indep.}\ \mathcal{N}(a_i,\sigma^2) \\[5pt] a_i &\sim \mathrm{i.i.d.}\ \mathcal{N}(a,\sigma_a^2) \end{align} 私はこれを意味すると理解しています 4.各個人のデータは正規に配布する必要がありますが、これは少数の時点でテストするのは不合理です。 私はそれを意味する3番目の表現を取ります 5.個々の被験者の平均は通常分布しています。これらは、上記の3つに加えて別の2つの異なる可能性があることに注意してください。 McCulloch、CE&Searle、SR(2001)。一般化モデル、線形モデル、および混合モデル。ニューヨーク:John …

1
SASとRのANOVAでのタイプIIIの二乗和の矛盾する結果
私は両方のアンバランス要因実験からのデータを分析していますSASとR。両方SASとR正方形の類似のタイプI和を提供するが、正方形のそのタイプIIIの和は互いに異なります。以下はSASとRコードと出力。 DATA ASD; INPUT Y T B; DATALINES; 20 1 1 25 1 2 26 1 2 22 1 3 25 1 3 25 1 3 26 2 1 27 2 1 22 2 2 31 2 3 ; PROC GLM DATA=ASD; CLASS T B; MODEL Y=T|B; RUN; SASのタイプI SS …
15 r  anova  sas  sums-of-squares 

1
ANOVAとRの自動車パッケージを対照的に設定および解釈する方法は?
ANOVAを実行したい単純な2x2階乗実験があるとします。このように、例えば: d <- data.frame(a=factor(sample(c('a1','a2'), 100, rep=T)), b=factor(sample(c('b1','b2'), 100, rep=T))); d$y <- as.numeric(d$a)*rnorm(100, mean=.75, sd=1) + as.numeric(d$b)*rnorm(100, mean=1.2, sd=1) + as.numeric(d$a)*as.numeric(d$b)*rnorm(100, mean=.5, sd=1) + rnorm(100); 有意な相互作用が存在しない場合、デフォルトでは(IEでcontr.treatmentの)出力Anova()の全体的な意義れるaのすべてのレベルを超えるbとのbのすべてのレベルを超えるa、その権利がありますか? どのように私は私が効果の重要性をテストできるようになるコントラスト指定する必要がありますaとb効果の、レベルB1で一定に保持されるaとbのレベルのB2で一定に保持している、との相互作用のをa:b?
15 r  anova  contrasts 


3
ANOVAの仮定(分散の等価性、残差の正規性)が重要なのはなぜですか?
ANOVAを実行すると、データに適用できるように、テストの特定の仮定が存在する必要があることが通知されます。テストが機能するために次の仮定が必要だった理由について、私は理解できませんでした。 従属変数(残差)の分散は、設計の各セルで等しくなければなりません 従属変数(残差)は、設計の各セルにほぼ正規分布する必要があります。 これらの仮定を満たす必要があるかどうかについて少し灰色の領域があることを理解していますが、議論のために、これらの仮定が特定のデータセットで完全に満たされていない場合、ANOVAを使用する際の問題は何でしょうか?

1
lmerモデルに使用する多重比較方法:lsmeansまたはglht?
1つの固定効果(条件)と2つのランダム効果(被験者内のデザインとペアによる参加者)を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 次に、固定効果(条件)のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。 私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

2
lrtest()がanova(test =“ LRT”)と一致しないのはなぜですか
モデルの適合度を比較するために、Rで尤度比検定を行う方法を探していました。私が最初にそれを自分でコード化され、デフォルトの両方見つかったanova()機能ともlrtest()にlmtestパッケージ。ただし、チェックするとanova()、「test」パラメータが「LRT」に設定されていても、常に他の2つの値とはわずかに異なるp値が生成されます。はanova()、実際にいくつかの微妙に異なるテストを実行する、または私は何かを理解していないのですか? プラットフォーム:Linux Mint 17で実行されているR 3.2.0 lmtestバージョン0.9-33で サンプルコード: set.seed(1) # Reproducibility n=1000 y = runif(n, min=-1, max=1) a = factor(sample(1:5, size=n, replace=T)) b = runif(n) # Make y dependent on the other two variables y = y + b * 0.1 + ifelse(a==1, 0.25, 0) mydata = data.frame(y,a,b) # Models base …

3
ベイジアンANOVAとRの回帰はどのように行いますか?[閉まっている]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、相互検証のトピックになるようにします。 2年前に閉店。 私は、1つの独立変数、1つの従属変数、およびカテゴリ変数で構成されるかなり単純なデータセットを持っています。私のようなfrequentistテストを実行している経験をたくさん持っているaov()とlm()、私はR.で自分のベイズ同等物を実行する方法を見つけ出すことはできません 最初の2つの変数に対してベイジアン線形回帰を実行し、分類としてカテゴリ変数を使用してベイジアン分散分析を実行したいのですが、Rでこれを行う方法について簡単な例を見つけることはできません。どちらも?さらに、ベイジアン分析によって作成された出力統計は正確に何であり、何を表していますか? 私は統計にあまり精通していませんが、コンセンサスはp値で基本的なテストを使用することはやや見当違いであると考えられているようであり、私はそれを維持しようとしています。よろしく。

1
変量効果を持つモデルのlmerで分散成分を推定し、lmeの結果と比較する方法
2つの異なるソース集団からの異なる家族を育てる実験を行いました。各家族には、2つの治療法のいずれかが割り当てられました。実験の後、私は各個人のいくつかの特性を測定しました。治療またはソースの効果とそれらの相互作用をテストするために、ランダムな因子として家族を持つ線形混合効果モデルを使用しました。 lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML") これまでのところ、ここで相対的な分散成分、つまり、相互作用だけでなく治療またはソースによって説明される変動の割合を計算する必要があります。 ランダム効果がなければ、平方和(SS)を簡単に使用して、各要因によって説明される分散を計算できます。しかし、混合モデル(ML推定あり)にはSSがありません。したがって、分散を推定するために、ランダム効果としてトリートメントとソースも使用できると考えました。 lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML") ただし、場合によっては、lmeが収束しないため、lme4パッケージのlmerを使用しました。 lmer(Trait~1+(Treatment*Source|Family),data=DATA) サマリー関数を使用してモデルから分散を抽出する場所: model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat) results<-VarCorr(model) variances<-results[,3] VarCorr関数と同じ値を取得します。次に、これらの値を使用して、合計を合計変動として、変動の実際の割合を計算します。 私が苦労しているのは、初期lmeモデルの結果の解釈(固定効果としての処理とソースを使用)と、分散コンポーネントを推定するランダムモデル(ランダム効果としての処理とソースを使用)です。ほとんどの場合、各要因によって説明される分散の割合は、固定効果の有意性に対応していないことがわかります。 たとえば、形質HDの場合、最初のlmeは、相互作用の傾向と治療の重要性を示唆しています。逆方向の手順を使用すると、治療にはかなりの傾向があることがわかります。ただし、分散コンポーネントを推定すると、Sourceの分散が最も高く、分散全体の26.7%を占めることがわかります。 lme: anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m") numDF denDF F-value p-value (Intercept) 1 426 0.044523 0.8330 as.factor(Treatment) 1 426 5.935189 0.0153 as.factor(Source) 1 11 0.042662 0.8401 as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533 そして、lmer: summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat)) Linear mixed model fit by REML Formula: …
14 r  anova  variance  lme4-nlme 

3
3因子ANOVAテーブルから因子を削除する
最近の論文で、3方向の固定効果モデルを適合させました。要因の1つは重要ではなかったため(p> 0.1)、それを削除し、2つの固定効果と相互作用でモデルを再適合させました。 引用するために、審判からコメントが返ってきました。 その時間は3因子ANOVAの重要な要因ではありませんでしたが、それ自体は時間要因をプールするための十分な基準ではありません。この問題に関する標準テキスト、Underwood 1997は、非有意効果のp値は因子の治療レベルをプールする前に0.25を超える。著者は、関連するp値をここに示し、Underwood 1997を参照してプーリングを正当化する必要があります。 私の質問は: 0.25ルールは聞いたことがありません。他に誰かいますか?p値がカットオフに近い場合、因子を削除しないことを理解できますが、「ルール」を持つことは少し極端に思えます。 この審判は、Underwood 1997が標準テキストであると述べています。本当か?そのようなことを聞​​いたのは初めてだ。標準テキストは何ですか(そのようなものは存在しますか)?残念ながら、1997年にこのUnderwoodにアクセスすることはできません。 審判に返答する際のアドバイス。 背景:この論文は非統計ジャーナルに投稿されました。3方向モデルをフィッティングするとき、相互作用効果をチェックしました。

4
フォローアップ:混合ANOVA間ANOVAプロットでは、推定SEまたは実際のSEですか?
私は現在論文を書き終えており、昨日からこの質問につまずいたので、自分に同じ質問を投げかけることになりました。データからの実際の標準誤差または私のANOVAから推定された標準誤差をグラフに提供する方が良いでしょうか? 昨日からの質問はかなり具体的ではなく、私の質問はかなり具体的であるため、このフォローアップの質問を提示することが適切だと思いました。 詳細: 認知心理学の領域(条件付き推論)で実験を実行し、2つのグループ(帰納的および演 ductive的指示、つまり被験者間操作)を2つの被験者内操作(問題のタイプと問題の内容、それぞれ2つの因子レベル)。 結果は次のようになります(ANOVA出力からのSE推定値の左パネル、データから推定されたSEの右パネル): 異なる線は2つの異なるグループ(つまり、被験者間操作)と、被験者の操作はx軸(つまり、2x2因子レベル)にプロットされます。 本文では、ANOVAのそれぞれの結果と、中央の重要なクロスオーバー相互作用の計画的な比較を提供します。SEは、データの変動性に関するヒントを読者に提供するためにあります。SDをプロットすることは一般的ではなく、被験者内および被験者間CIを比較する際に深刻な問題があるため、標準偏差および信頼区間よりもSEの方が好きです(同じことがSEにも当てはまるため、有意差を誤って推測することはそれほど一般的ではありません)それらから)。 私の質問を繰り返します:ANOVAから推定されたSEをプロットする方が良いのですか、それとも生データから推定されたSEをプロットすべきですか? 更新: 推定SEが何であるかをもう少し明確にすべきだと思います。SPSSのANOVA出力はestimated marginal means、対応するSEとCIを提供します。これが左のグラフにプロットされています。これを理解している限り、それらは残差のSDである必要があります。ただし、残差を保存する場合、SDは推定SEに多少なりとも近くありません。したがって、2番目の(潜在的にSPSS固有の)質問は次のとおり です。これらのSEとは何ですか? 更新2:最終的に気に入ったのでプロットを作成できるR関数を作成することができました(受け入れられた回答を参照)。誰かに時間があれば、あなたがそれを見ることができれば本当に感謝します。ここにあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.