タグ付けされた質問 「anova」

ANOVAは、複数のグループ平均を比較するための統計モデルおよび一連の手順であるVArianceのANalysisの略です。ANOVAモデルの独立変数はカテゴリカルですが、ANOVAテーブルを使用して連続変数をテストすることもできます。

4
MANOVAと従属変数間の相関関係:どれほど強すぎるか?
MANOVAの従属変数は、「相関が強すぎる」べきではありません。しかし、どれだけ強い相関が強すぎるのでしょうか?この問題について人々の意見を得ることは興味深いでしょう。たとえば、以下の状況でMANOVAを続行しますか? Y1およびY2は、およびと相関していますr = 0.3r=0.3r=0.3p &lt; 0.005p&lt;0.005p<0.005 Y1とY2は、およびと相関しています。r = 0.7r=0.7r=0.7p = 0.049p=0.049p=0.049 更新 @onestopへの応答としてのいくつかの代表的な引用: 「MANOVAは、DV間に中程度の相関がある状況でうまく機能します」(San Francisco State Uniからのコースノート) 「従属変数には相関関係があり、これはManovaに適しています」(米国EPA統計入門) 「従属変数は概念的に関連している必要があり、それらは低レベルから中程度のレベルで互いに相関している必要があります。」(北アリゾナ大学からのコースノート) 「約.3から約.7に相関するDVは適格です」(Maxwell 2001、Journal of Consumer Psychology) nb Y1とY2の間の相互相関が独立変数のすべてのレベルで同じであるという仮定については言及していません。相互相関の実際の大きさに関するこの見かけ上の灰色の領域についてのみです。

5
反復測定anovaの正規性の仮定をテストしますか?(R)
したがって、anovaの正規性の仮定のテストにポイントがあると仮定します(1および2を参照)。 Rでどのようにテストできますか? 私は次のようなことを期待しています: ## From Venables and Ripley (2002) p.165. utils::data(npk, package="MASS") npk.aovE &lt;- aov(yield ~ N*P*K + Error(block), npk) residuals(npk.aovE) qqnorm(residuals(npk.aov)) 「残差」には、反復測定anovaの場合の方法(つまり、予測)がないため、これは機能しません。 それでは、この場合何をすべきでしょうか? 残差は、エラー項なしで同じフィットモデルから単純に抽出できますか?私はこれが有効であるかどうかを知るのに十分なほど文献に精通していません。

3
事後処理制御設計における相互作用効果の効果サイズ
混合ANOVAを使用して、連続従属変数を使用して治療前後の制御デザインを分析する場合、治療グループにいることの効果を定量化するさまざまな方法があります。相互作用効果は1つの主要なオプションです。 一般的に、私はコーエンのdタイプのメジャー(つまり、)が特に好きです。結果はグループの相対的なサンプルサイズなどの無関係な要因に基づいて変化するため、分散説明メジャーは好きではありません。μ1- μ2σμ1−μ2σ{\frac{\mu_1 - \mu_2}{\sigma}} そこで、次のように効果を数値化できると考えていました Δのμc= μc 2- μc 1Δμc=μc2−μc1\Delta\mu_c = \mu_{c2} - \mu_{c1} Δのμt= μt 2- μt 1Δμt=μt2−μt1\Delta\mu_t = \mu_{t2} - \mu_{t1} したがって、効果サイズはとして定義できますΔのμt- Δ μcσΔμt−Δμcσ\frac{\Delta\mu_t - \Delta\mu_c}{\sigma} ここで、はコントロール、は治療、1と2はそれぞれ前と後を示します。 は、時間1のプールされた標準偏差である可能性があります。ccctttσσ\sigma 質問: この効果の大きさの測定にラベルを付けることは適切dですか? このアプローチは合理的ですか? そのようなデザインの効果サイズ測定の標準的な方法は何ですか?

4
非独立な観測を伴う分散分析
この質問の冗長な背景でごめんなさい: 時折、動物の行動の調査において、実験者は、被験者が試験装置の異なる事前定義されたゾーンに費やす時間に関心を持っています。私は、ANOVAを使用して分析されたこの種のデータをよく見ました。ただし、ANOVAは観測値が独立していると想定し、これらの分析では実際には独立していないため、そのような分析の妥当性を完全に確信したことはありません(1つのゾーンで費やされる時間が長いほど、他のゾーンで費やされる時間が少なくなるためです! )。 例えば、 DR Smith、CD Striplin、AM Geller、RB Mailman、J。Drago、CP Lawler、M。Gallagher、D1Aドーパミン受容体を欠くマウスの行動評価、Neuroscience、Vol。86、Issue 1、21 May 1998、ページ135-146 上記の記事では、非独立性を補うために自由度を1だけ減らしています。ただし、そのような操作が実際にこの分散分析の仮定の違反を改善できるかどうかはわかりません。 カイ二乗法の方が適切かもしれません。このようなデータを分析するにはどうしますか(ゾーンで費やされた時間に基づくゾーンの設定)。 ありがとう!
11 anova 

1
バイナリデータにANOVAをどのように適応できますか?
私は4つの競合するモデルを使用して、n人の被験者のバイナリ結果変数(卒業後の雇用状況、1 =就業、0 =非就業など)を予測しています。モデルパフォーマンスの自然な測定基準は、ヒット率であり、これは各モデルの正しい予測の割合です。 データが分散分析の基礎となる仮定に違反しているため、この設定では分散分析を使用できないようです。上記の設定でANOVAの代わりに使用できる同等の手順で、4つのモデルすべてが同等に効果的であるという仮説をテストできますか?

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 &lt;- function(x,z,sx=0.3,sz=0.4) { x &lt;- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n &lt;- 500 x &lt;- runif(n)/20;z &lt;- runif(n); xs &lt;- seq(0,1,length=30)/20;zs &lt;- seq(0,1,length=30) pr &lt;- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth &lt;- matrix(test1(pr$x,pr$z),30,30) f &lt;- test1(x,z) y &lt;- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
箱ひげ図を読む:グループ間の有意差を収集することは可能ですか?
次の箱ひげ図を見ているとしましょう: 木曜日と金曜日の間、私はほとんどの人が睡眠時間に大きな違いがあるように思われることに同意すると思います。しかし、それは統計的に有効な推測ですか?木曜日と金曜日の間で四分位範囲のどちらも重複しないという事実のために、私たちは有意差を識別できますか?木曜日と金曜日のウィスカの上部と下部がそれぞれ重なっているという事実はどうですか?それは分析に影響しますか? 通常、このようなチャートに付随するのはある種の分散分析ですが、箱ひげ図を見るだけでグループ間の違いについてどれだけ言えるか知りたいです。

2
2つの平均を比較するためにt検定の代わりに分散分析を使用することは間違っていますか?
給与の分布があるので、男性と女性の平均の違いを比較したいと思います。2つの平均を比較するための学生のT検定があることは知っていますが、分散分析を提案した後、分散分析は3つ以上の平均を比較するためのものであるという批判を受けました。 2つだけの手段を比較するためにそれを使用することで何が(もしあれば)間違っていますか?

2
lme4 :: lmerは3因子反復測定分散分析に相当しますか?
私の質問は、どのモデルが双方向反復測定分散分析に対応するかを示したこの応答に基づいていますlme4::lmer。 require(lme4) set.seed(1234) d &lt;- data.frame( y = rnorm(96), subject = factor(rep(1:12, 4)), a = factor(rep(1:2, each=24)), b = factor(rep(rep(1:2, each=12))), c = factor(rep(rep(1:2, each=48)))) # standard two-way repeated measures ANOVA: summary(aov(y~a*b+Error(subject/(a*b)), d[d$c == "1",])) # corresponding lmer call: anova(lmer(y ~ a*b+(1|subject) + (1|a:subject) + (1|b:subject), d[d$c == "1",])) 私の質問は、これを三元配置分散分析の場合に拡張する方法です。 …

2
t検定と一元配置分散分析はどちらもWald検定ですか?
正規分布サンプルの平均が定数に等しいかどうかをテストするt検定は、サンプル平均での正規分布の漁師の情報によってサンプル平均の標準偏差を推定することにより、Waldテストと呼ばれます。しかし、t検定の検定統計量にはスチューデントのt分布があり、Wald検定の検定統計量には漸近的にカイ二乗分布があります。どう説明したらいいの? 一元配置分散分析では、検定統計量はクラス間分散とクラス内分散の間の比率として定義されます。Waldテストでもあるのかと思っていました。ただし、一元配置分散分析の検定統計量にはF分布があり、ワルド検定の検定統計量には漸近的にカイ二乗分布があります。どう説明したらいいの? よろしくお願いします!

1
繰り返し測定anova:lmとlmer
私は両方lmとの間でlmer繰り返しの測定(2x2x2)でいくつかの相互作用テストを再現しようとしています。両方の方法を比較したいのは、繰り返し測定のSPSSのGLMがlmここに示したアプローチとまったく同じ結果をもたらすため、最後にSPSSとR-lmerを比較したいためです。これまでのところ、私はこれらの相互作用の一部を(密接に)再現することしかできませんでした。 私のポイントをよりよく説明するためのスクリプトを以下に示します。 library(data.table) library(tidyr) library(lmerTest) library(MASS) set.seed(1) N &lt;- 100 # number of subjects sigma &lt;- 1 # popuplation sd rho &lt;- .6 # correlation between variables # X1: a a a a b b b b # X2: a a b b a a b b # X3: a …

2
堅牢な標準誤差を含む分散分析表を取得するにはどうすればよいですか?
私はRのplmパッケージを使用してプールされたOLS回帰を実行しています。ただし、私の質問は基本的な統計に関するものなので、まずここに投稿してみます;) 私の回帰結果は不等分散残差を生成するので、不等分散ロバスト標準誤差を使用してみます。その結果、coeftest(mod, vcov.=vcovHC(mod, type="HC0"))各独立変数の推定値、標準誤差、t値、およびp値を含むテーブルが得られます。これらは基本的に私の「堅牢な」回帰結果です。 さまざまな変数の重要性を議論するために、各独立変数によって説明される分散のシェアをプロットしたいので、それぞれの二乗和が必要です。しかし、functionを使用するとaov()、Rに堅牢な標準エラーを使用するように指示する方法がわかりません。 今私の質問は:どのようにしてロバストな標準誤差を参照するANOVAテーブル/平方和を取得するのですか?通常の標準誤差のある回帰からの分散分析表に基づいてそれを計算することは可能ですか? 編集: つまり、Rの問題を無視します。 Rがロバストな標準誤差を使用しても影響を受けない場合、さまざまな説明変数による説明付き分散へのそれぞれの寄与も変化しませんか?22^2 編集: Rでは、aov(mod)実際にpanelmodel(plm)の正しいANOVAテーブルを提供しますか?

3
反復測定ANOVAが球形性を仮定するのはなぜですか?
反復測定ANOVAが球形性を仮定するのはなぜですか? 球形性とは、グループ間のすべてのペアごとの差異の分散が同じであるという仮定を意味します。 特に、これがなぜ仮定である必要があるのか​​、また観察されたグループスコアの分散自体が同じであるのではないのか、私にはわかりません。

2
lmerTest :: anovaの自由度は正しいですか?RM-ANOVAとは大きく異なります
Rでの反応時間実験の結果を分析しています。 私は反復測定ANOVAを実行しました(2レベルの被験者内因子1つと2レベルの被験者間因子1つ)。私は同様の線形混合モデルを実行し、lmerの結果をを使用してANOVA表の形式で要約したいと思いましたlmerTest::anova。 誤解しないでください。同じ結果になるとは思っていませんでしたが、結果の自由度についてはわかりませんlmerTest::anova。それは、主題レベルでの集約のない分散分析を反映しているように思えます。 混合効果モデルの自由度を計算するのは難しいことを私は知っていlmerTest::anovaますが、更新されたものの1つの可能な解決策として言及されています?pvaluesトピック(lme4パッケージ)ます。 この計算は正しいですか?の結果はlmerTest::anova指定されたモデルを正しく反映していますか? アップデート:個人差を大きくしました。の自由度はlmerTest::anova単純なanovaとは異なりますが、なぜ被験者内因子/相互作用に対してそれらがそれほど大きいのかはまだわかりません。 # mini example with ANT dataset from ez package library(ez); library(lme4); library(lmerTest) # repeated measures ANOVA with ez package data(ANT) ANT.2 &lt;- subset(ANT, !error) # update: make individual differences larger baseline.shift &lt;- rnorm(length(unique(ANT.2$subnum)), 0, 50) ANT.2$rt &lt;- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)] anova.ez &lt;- ezANOVA(data = …

2
二元配置分散分析は適切ですか?
これは私の研究の説明です。私は、A、B、Cの3つの植物で実験しています。これらの植物は、糖尿病患者の血糖値を下げると考えられています。これらの3つの植物のどれが、マウスへの単回投与後の血糖値低下により長い影響を与えるかを調べたいと思います。これは、7つの時点(1、2、3、5、7、10、および14日目)でのマウスの血糖値を測定することによって行われます。したがって、4つのグループがあります(未処理、Aで処理、Bで処理、Cで処理)。各グループに3匹のマウスを使用した(n = 3)。私の目標は: 各植物処理の効果が未処理と比較して重要かどうかを判断します。 毎日のグループ間での効果を比較します。 14日後に最も効果のある治療グループを特定します。 私の解決策は、2つ以上のグループがあるため、2因子ANOVAを使用することです。毎日のグループを比較し、最後に全体的な効果を比較します。 これは正しい方法ですか?2番目と3番目に続く最高の植物をランク付けできますか?または時系列分析を使用する必要がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.