タグ付けされた質問 「anova」

ANOVAは、複数のグループ平均を比較するための統計モデルおよび一連の手順であるVArianceのANalysisの略です。ANOVAモデルの独立変数はカテゴリカルですが、ANOVAテーブルを使用して連続変数をテストすることもできます。

1
Anovaの結果で使用される平方和のタイプが論文でほとんど報告されないのはなぜですか?
統計における私の短い経験に続いて、ANOVA結果を取得するために使用される二乗和のタイプ(タイプI、II、III、IV ...)は、テスト結果(特に、相互作用と欠落のあるモデル)に劇的な違いをもたらす可能性があるデータ)。しかし、それを報告する論文はまだ見ていません。どうしてこんなことに? (統計自体ではなく)何らかの方法でそれを報告する紙の例、またはそれが一般的ではない理由を提供していただければ幸いです。

1
ANOVAはどのような質問に答えますか?
分散分析を学びたいです。アルゴリズムのしくみ(どのような計算を行う必要があるか)とその理由を学ぶ前に、まずANOVAで実際に解決する問題、または回答しようとする答えを知りたいと思います。言い換えると、アルゴリズムの入力と出力は何ですか? 入力として何を使用するか理解しています。数字のセットがあります。各数値には、1つ以上のカテゴリ変数(「因子」とも呼ばれます)の値が付属しています。例えば: +------------+------------+-------+ | factor 1 | factor 2 | value | +------------+------------+-------+ | "A" | "a" | 1.0 | | "A" | "a" | 2.4 | | "A" | "b" | 0.3 | | "A" | "b" | 7.4 | | "B" | "a" | 1.2 | | "B" …
9 anova 

1
2つのモデルの比較にanovaを使用する方法
anova2つのモデルを比較するときの結果をどのように理解すればよいですか? 例: Res.Df RSS Df Sum of Sq F Pr(>F) 1 9 54.032 2 7 4.632 2 49.4 37.329 0.0001844 *** マンページには、「1つまたは複数の適合モデルオブジェクトの分散(または逸脱)の計算分析テーブル」と記載されています。しかし、外の教授はそれがモデルの比較に使用されるかもしれないと述べました-それは私がやろうとしていることです。 したがって、私はanova(model1, model2)、帰無仮説「モデルは同じ」を棄却する必要があるかどうかを示すp値を使用して取得できると想定します。 p値が(たとえば、)0.05未満の場合、モデルが大幅に異なると述べてもよいですか?
9 r  regression  anova 

1
GLMMのanovaタイプIIIテスト
Rパッケージのglmerモデルを装着していlme4ます。p値が表示されたanovaテーブルを探していますが、それに適合するパッケージが見つかりません。Rでそれを行うことは可能ですか? 私が適合しているモデルは次の形式です: model1<-glmer(dmn~period*teethTreated+(1|fullName), family="poisson", data=subset(dataset, group=='Four times a year'), control=glmerControl(optimizer="bobyqa"))


1
R:Anovaと線形回帰
私は統計に不慣れで、ANOVAと線形回帰の違いを理解しようとしています。私はこれを調査するためにRを使用しています。ANOVAと回帰が異なるのになぜ同じであるか、どのように視覚化できるかなど、さまざまな記事を読みました。 ANOVAがグループ内の分散とグループ間の分散を比較して、テストされたグループ間に差異があるかどうかを判断することを理解しています。(https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA) 線形回帰の場合、私はこのフォーラムでb(勾配)= 0かどうかをテストすると同じことがテストできるという投稿を見つけました。) 3つ以上のグループについて、次のようなウェブサイトを見つけました。 帰無仮説は次のとおりです:H0:µ1=µ2=µ3H0:µ1=µ2=µ3\text{H}_0: µ_1 = µ_2 = µ_3 線形回帰モデルは次のとおりです:y=b0+b1X1+b2X2+ey=b0+b1X1+b2X2+ey = b_0 + b_1X_1 + b_2X_2 + e ただし、線形回帰の出力は1つのグループの切片であり、他の2つのグループの切片との差です。(http://www.real-statistics.com/multiple-regression/anova-using-regression/) 私にとって、これは実際には傾きではなく切片が比較されているように見えますか? 勾配ではなく切片を比較する別の例は、ここにあります:(http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/) 線形回帰で実際に比較されるものを理解するのに苦労していますか?傾斜、切片、またはその両方?
9 r  regression  anova 

1
タイプIIIの二乗和
私は、1つのカテゴリー変数(男性と女性)と1つの連続変数を持つ線形回帰モデルを持っています。AAABBB Rのコントラストコードをで設定しましたoptions(contrasts=c("contr.sum","contr.poly"))。そして今、私は、タイプIIIの二乗和と、を使用したそれらの相互作用(A:B)があります。AAABBBdrop1(model, .~., test="F") 私が行き詰まっているのは、二乗和の計算方法です。だBBBと思いますsum((predicted y of the full model - predicted y of the reduced model)^2)。縮小モデルはのようになりますy~A+A:B。しかし、を使用するとpredict(y~A+A:B)、Rは完全なモデルの予測値と同じ予測値を返します。したがって、平方和は0になります。 (の二乗和には、の縮小モデルを使用しました。これはと同じです。)AAAy~B+A:By~A:B 以下は、ランダムに生成されたデータのコード例です。 A<-as.factor(rep(c("male","female"), each=5)) set.seed(1) B<-runif(10) set.seed(5) y<-runif(10) model<-lm(y~A+B+A:B) options(contrasts = c("contr.sum","contr.poly")) #type3 sums of squares drop1(model, .~., test="F") #or same result: library(car) Anova(lm(y~A+B+A:B),type="III") #full model predFull<-predict(model) #Calculate sum of squares #SS(A|B,AB) predA<-predict(lm(y~B+A:B)) …

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


2
グループ間の(いくつかの)分位Qの違いをテストしていますか?
3つのグループ(X)に分割されているいくつかのY変数について、グループを比較し、90%の変位値が3つのグループすべてで同じであるという仮説を立てます。どのようなテストを使用できますか? 私が考えることができる1つのオプションは、分位回帰を使用することですが、他の選択肢/アプローチはありますか? 中央値を比較したい場合は、クラスカルウォリス検定を使用できたと思います(ランクに基づいていますが、正しく覚えていれば、残差分布が対称である場合に同じ結果が得られます)。 ありがとう。

2
SPSS出力を正しく解釈するための反復測定ANOVA仮定の理解
さまざまな報酬条件がタスクのパフォーマンスに影響を与える可能性があるかどうかを調査しています。それぞれn = 20の2つのグループによる小規模な研究のデータがあります。3つの異なる「報酬」条件でのパフォーマンスに関連するタスクのデータを収集しました。タスクには、3つの条件のそれぞれにおけるパフォーマンスが2回、ランダムな順序で含まれていました。異なる「報酬」条件のそれぞれで、各グループのタスクパフォ​​ーマンスに平均差があるかどうかを確認したいと思います。 IV =グループタイプ DV = 3つの条件にわたるタスクパフォ​​ーマンスの平均測定値 反復測定ANOVAからの出力とSPSSの生データセットへのアクセスがありますが、続行方法がわかりません。Pallantのテキストは多少制限されているため、この解釈の段階的なガイドを見つけることができませんでした。私の特定の問題は次の分野にあります: 各変数の正常性を個別に、またはIVの各レベルの組み合わせ内でチェックしますか?それが組み合わせ内にある場合、それをどのようにチェックしますか? 最初にモークリーのテストをチェックしますか?違反している場合、それはどういう意味ですか?違反していない場合、それはどういう意味ですか? 多変量テストの表、または被験者内効果のテストをいつ見ても大丈夫ですか?どちらか(または両方?)を使用するのが適切かどうかはわかりません。 ペアワイズ比較を見ても大丈夫ですか?多変量または被験者内効果が有意性を示さない場合(つまり、P <0.05)、そうすることは直観に反するように見えますが、私は再び確信が持てません。

1
制御と治療の違いは明示的または暗黙的にモデル化する必要がありますか?
次の実験的なセットアップを前提とします。 複数のサンプルが対象から取得され、各サンプルは複数の方法で処理されます(コントロール処理を含む)。主に興味深いのは、コントロールと各処理の違いです。 このデータの2つの単純なモデルを考えることができます。サンプル、処理、処理0をコントロールとして、データ、をサンプルのベースライン、を処理差とします。最初のモデルは、コントロールと違いの両方を調べます。iiijjjYijYijY_{ij}γiγi\gamma_iiiiδjδj\delta_jjjj Yij=γi+δj+ϵijYij=γi+δj+ϵij Y_{ij}=\gamma_i+\delta_j+\epsilon_{ij} δ0=0δ0=0 \delta_0=0 一方、2番目のモデルは違いのみを確認します。もし我々事前計算予め 次に dijdijd_{ij}dij=Yij−Yi0dij=Yij−Yi0 d_{ij}=Y_{ij}-Y_{i0} dij=δj+εijdij=δj+εij d_{ij}=\delta_j+\varepsilon_{ij} 私の質問は、これら2つのセットアップの基本的な違いは何ですか?特に、レベル自体が無意味であり、違いのみが重要である場合、最初のモデルはあまりにも多くを行っており、おそらく能力が不足していますか?


2
ペアの反復測定ANOVAまたは混合モデル?
血圧を測定する2つの方法を検討している臨床試験のデータを分析するように依頼されました。50の被験者からのデータがあり、各方法を使用してそれぞれ2〜57のメジャーがあります。 どのように進めるのが最善かと思います。 明らかに、血圧の測定値がペアになっている(2つの方法が同時に測定されている)ことと、時間変化する共変量(患者ごとに異なる数の観察が行われること)を考慮し、内部と内部の両方を考慮に入れるソリューションが必要です。患者の多様性。 どういうわけかこれを繰り返し測定ANOVAに靴角掛けすることを考えていましたが、混合モデルのアプローチが必要かもしれないと思っています。 役立つアドバイスをいただければ幸いです。 私は完全なR初心者ですが、スキルを開発することに非常に興奮しており、私はスタタで適度な経験を持っているので、いつでもそれに頼ることができます。
9 r  anova  mixed-model  stata 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.