統計とビッグデータ anova

3

K平均分析後のANOVAテーブルの後の通知は、距離を最大化するためにクラスター解がユークリッド距離に基づいて導出されているため、有意水準を同等平均のテストと見なすべきではないことを示しています。クラスタリング変数の平均がクラスター間で異なるかどうかを示すために、どのテストを使用する必要がありますか？この警告はk-means出力の提供されたANOVAテーブルで見ましたが、いくつかの参考文献では、事後ANOVAテストが実行されていることがわかります。k-mean ANOVA出力を無視し、事後検定で一元配置ANOVAを実行し、従来の方法で解釈する必要がありますか？または、F値の大きさだけを暗示したり、どの変数が差に寄与したかを示すことはできますか？別の混乱は、クラスタリング変数がANOVAの仮定に違反して正規分布していないことです。Kruskal-Wallisノンパラメトリック検定を使用できますが、同じ分布に関する仮定があります。特定の変数のクラスター間分布は同じように見えず、一部は正に歪んでおり、一部は負になっています... 1275個の大きなサンプル、5つのクラスター、10個のクラスター変数がPCAスコアで測定されています。

14 anova k-means

1

反復測定ANOVAに必要なサンプルサイズの決定方法

繰り返し測定ANOVAについての助けが必要です。一部の病棟における血流感染（BSI）率の低下に対する何らかの介入の効果を調査しています。BSIレート情報は、毎月、最初は介入なしで12か月、次に介入ありで12か月で取得する予定です。時系列または反復測定ANOVAのいずれかを実行することを考えています。最初の分析ではあまり考えないうちに、後の分析を選択します（追加の質問：時間点が少なすぎますか？）。別の問題として、BSI率に対する介入の統計的に有意な効果があることを示すために、いくつの病棟が必要ですか？「介入前」と「介入中」の2つのANOVAを行うと思います。また、「介入前」のANOVAに有意なF比検定を行うべきではないと思います。「サンプルサイズ」という用語は、病棟の数または繰り返し測定の数のいずれかで、2次元で考慮します。

14 anova repeated-measures sample-size power

1

複合対称の場合の（0 + factor | group）および（1 | group）+（1 | group：factor）ランダム効果の仕様の等価性

ダグラス・ベイツは、次のモデルは「ベクトル値のランダム効果の分散共分散行列が複合対称性と呼ばれる特別な形式を持っている場合」と同等であると述べています（このプレゼンテーションのスライド91）。 m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体的には、Batesは次の例を使用します。 library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 対応する出力： print(m1a, corr …

13 r anova mixed-model repeated-measures lme4-nlme

1

ANOVAは最尤法ではなくモーメント法に依存していますか？

さまざまな場所で、ANOVAはモーメント法を使用して推定を行うと述べています。瞬間の方法に精通していなくても、それは最尤法とは異なるものであり、同等ではないという私の理解だからです。一方、ANOVAは、カテゴリ予測変数との線形回帰として見ることができ、回帰パラメータのOLS推定は、ある最大尤。そう： ANOVA手順をモーメント法として適格とするものは何ですか？ ANOVAは、カテゴリカル予測子を使用したOLSと同等であるため、最尤ではありませんか？通常のANOVAの特殊なケースでこれら2つの方法が何らかの形で同等であることが判明した場合、差異が重要になる特定のANOVA状況はありますか？不均衡な設計？繰り返し測定？混合（被験者間+被験者内）デザイン？

13 anova mixed-model maximum-likelihood method-of-moments

1

ANOVAのテストの

イントロ：この質問で、今日受け取っ注意を指摘した、「？ペアワイズt検定のいずれでもないとき缶ANOVAが重要である、」私は答えの独自のセットに値するだろう面白い方法でそれをリフレームすることができるかもしれないと思いました。統計的有意性が単純な二分法として理解され、より高い基準に基づいて判断される場合、または場合、さまざまな不整合な結果（額面）が発生する可能性があります。上記の質問に対する @Glen_bの回答は、次の場合の有用な例を示しています。P αppα\alpha ANOVA F検定FFは、4つのレベルを持つ1つの独立変数（IV）に対してp F < .05pF<.05p_F<.05を生成しますが、 IVの4つのレベルの各ペアに対応する観測値間で、同じ従属変数（DV）の差を比較するpt>.08p_t>.08すべての2サンプル ttt検定で p t > .08。この質問による事後のペアワイズ比較のボンフェローニ補正にもかかわらず、同様のケースが発生しました：Anovaの反復測定は重要ですが、ボンフェローニ補正とのすべての多重比較はそうではありませんか？重回帰のテストがわずかに異なる前述のケースも存在します。有意なF統計量（p <.001）であるが有意ではないリグレッサーt検定を取得できるのはなぜですか？：P F < 0.001 、P β T > 0.09pF<.001,pβt>.09p_F<.001,p_{\beta t}>.09 回帰はどのように有意であるが、すべての予測変数は有意ではないのでしょうか？ @ whuberさんに答え、P F = 0.0003 、P β T > 0.09pF=.0003,pβt>.09p_F=.0003,p_{\beta t}>.09 私は賭けてこのような場合には、ことをいくつかの（すべてではない）ペアごとの比較（または回帰係数有意性検定）のppp値はかなり近いでなければならないαα\alpha対応オムニバステストが達成できるかどうかのp < αをp<αp <\alpha。私は、これがGlen_bの最初の例@における場合であり、参照F （3 、20 ） = 3.19F(3,20)=3.19F_{(3,20)}=3.19、P F = …

13 hypothesis-testing anova statistical-significance t-test multiple-comparisons

3

分散分析（ANOVA）で片側検定F検定を使用する理由

分散分析テストで片側検定を使用する理由を教えてください。 ANOVAで片側検定（F検定）を使用する理由

13 anova f-test sums-of-squares f-distribution

3

F統計、Fクリティカル値、およびP値

私はこの分野には非常に新しく、ANOVAテーブルの結果に基づいて帰無仮説を拒否する概念を理解するのが困難です。計算されたFと臨界値はp値にどのように関係しますか？また、計算されたFが1より大きい場合、p値がアルファより小さい場合でも、常に帰無仮説が棄却されることを示していますか？これらの質問が私の無知のしるしである場合は申し訳ありませんが、私は57歳であり、35年ぶりに学校に戻っています！助けてくれてありがとう。

13 anova

2

グループ化されたペアを示すテーブルでテューキーHSD事後検定の結果を取得する方法

Rとの双方向のAnovaの後、TukeyHSD事後検定を実行して、有意差でグループ化されたソートされたペアを含むテーブルを取得したいと思います。（言い回しについては申し訳ありませんが、私はまだ統計に新しいです。）私はこのようなものが欲しいです：だから、星や文字でグループ化。何か案が？パッケージHSD.test()から関数をテストしましたが、agricolae双方向テーブルを処理していないようです。

13 r anova multiple-comparisons post-hoc tukey-hsd

2

系統依存変数：ANOVA？

系統発生データから共分散行列を導出して、回帰を行う2つの変数のになることを理解しています。しかし、系統発生に依存していることが以前に示された連続変数が1つ、順序変数が1つある場合はどうなりますか？後者は序数であるため、系統発生的依存がバイアスされたテスト統計をもたらす方法にこれをどのように関連付けるかはわかりません。c o v （X、Y）= 0cov（バツ、Y）=0cov(X,Y) = 0 連続変数でFelsensteinの系統発生独立コントラストを計算し、ANOVAに使用することは意味がありますか？ PIC値は次のとおりですC私はj= （X私− Xj）d私はj−−√C私j=（バツ私−バツj）d私jC_{ij} = \frac{(X_i - X_j)}{\sqrt{d_{ij}}} ここで、あるXの種のために私は、X jはあるX種のためにJ、およびD I jは種間のペアワイズ距離でIとJ系統樹上。バツ私バツ私X_iバツバツX私、Xj私、バツji, X_jバツバツXjjjd私はjd私jd_{ij}私私ijjj

13 anova phylogeny

3

要因ANOVAでエラー用語を正当化する方法は？

多因子ANOVAに関するおそらく非常に基本的な質問。主効果A、B、および相互作用A：Bの両方をテストする双方向設計を想定します。タイプI SSでAの主効果をテストするとき、効果SSは差として計算されます。ここで、は切片のみのモデルの残差平方和です。そして、を追加ファクタAとモデルのRSS。私の質問は、エラー用語の選択に関するものです。R S S （1 ）R S S （A ）R SS（1 ）− R SS（A ）RSS（1）−RSS（A）RSS(1) - RSS(A)R SS（1 ）RSS（1）RSS(1)R SS（A ）RSS（A）RSS(A) このテストのエラー項が、主効果と相互作用の両方を含むフルモデルA + B + A：BのRSSから通常計算されることをどのように正当化しますか？ FA= （R SS1− R SSA）/（dfR SS1− dfR SSA）R SSA + B + A ：B/ dfR SSA + B + A ：BFA=（RSS1−RSSA）/（dfRSS1−dfRSSA）RSSA+B+A：B/dfRSSA+B+A：B F_{A} = \frac{(RSS_{1} …

13 anova linear-model

1

反復測定計画のANOVAはどのように計算されますか：Rのaov（）vs lm（）

タイトルはそれをすべて言っており、私は混乱しています。以下は、Rで反復測定aov（）を実行し、同等のlm（）呼び出しと考えたものを実行しますが、異なる誤差残差を返します（ただし、平方和は同じです）。 aov（）の残差と近似値は、モデルで使用されるものです。これらの平方和は、summary（my.aov）で報告されるモデル/残余平方和のそれぞれに加算されるためです。それでは、反復測定設計に適用される実際の線形モデルは何ですか？ set.seed(1) # make data frame, # 5 participants, with 2 experimental factors, each with 2 levels # factor1 is A, B # factor2 is 1, 2 DF <- data.frame(participant=factor(1:5), A.1=rnorm(5, 50, 20), A.2=rnorm(5, 100, 20), B.1=rnorm(5, 20, 20), B.2=rnorm(5, 50, 20)) # get our experimental conditions conditions <- …

13 r anova repeated-measures linear-model

4

パーセンテージでANOVAを使用していますか？

独立変数（因子）として4つのグループ（4つのBMIグループ）を持つテーブルがあります。「妊娠中の母親の喫煙率」という従属変数があります。このためにANOVAを使用することは許可されますか、またはカイ2乗または他のテストを使用する必要がありますか？

13 anova

4

ANCOVAでの事後テスト

質問：共変量の効果を調整した後、グループ平均間の差の事後検定を行うための良い方法は何ですか？プロトタイプの例： 4つのグループ、グループごとに30人の参加者（たとえば、4つの異なる臨床心理学集団）従属変数は数値です（インテリジェンススコアなど）共変量は数値です（たとえば、社会経済的地位の指標）研究の質問は、共変量を制御した後、従属変数でグループのペアが有意に異なるかどうかに関するものです。関連する質問：好ましい方法は何ですか？ Rではどのような実装が利用可能ですか？共変量が事後テストの実施手順をどのように変更するかについての一般的な参考文献はありますか？

13 anova multiple-comparisons ancova

1

GAM近似の概要

GAMを次のように適合させる場合： gam.fit = gam::gam(Outstate ~ Private + s(Room.Board, df = 2) + s(PhD, df = 2) + s(perc.alumni, df = 2) + s(Expend, df = 5) + s(Grad.Rate, df = 2), data = College) ここでCollege、パッケージ内にあるデータセットを使用しますISLR。さて、この適合の要約を見つけると、次のことがわかります。 > summary(gam.fit) Call: gam(formula = Outstate ~ Private + s(Room.Board, df = 2) + …

12 anova gam

1

ANOVA：グループごとのサンプル数が少ない多くのグループの正規性の仮定のテスト

次の状況を想定します。小さいグループサイズ（たとえばn = 3）で多数（たとえば20）があります。均一な分布から値を生成すると、エラー分布が均一であっても残差がほぼ正規に見えることに気付きました。次のRコードは、この動作を示しています。 n.group = 200 n.per.group = 3 x <- runif(n.group * n.per.group) gr <- as.factor(rep(1:n.group, each = n.per.group)) means <- tapply(x, gr, mean) x.res <- x - means[gr] hist(x.res) 3つのグループのサンプルの残差を見ると、動作の理由は明らかです。 r1= x1− 平均（x 1 、x 2 、x 3 ）= x 1 − x1+ x2+ x33= 23バツ1− x2− …

12 anova normal-distribution small-sample

タグ付けされた質問 「anova」

タグ付けされた質問「anova」