タグ付けされた質問 「anova」

ANOVAは、複数のグループ平均を比較するための統計モデルおよび一連の手順であるVArianceのANalysisの略です。ANOVAモデルの独立変数はカテゴリカルですが、ANOVAテーブルを使用して連続変数をテストすることもできます。


1
部分決定係数のR実装
誰かが部分決定係数を計算する提案やパッケージを持っていますか? 部分決定係数は、縮小モデルでは説明できない変動のパーセントとして定義できますが、完全モデルでは指定された予測子で説明できます。この係数は、1つ以上の追加の予測子が、より完全に指定された回帰モデルで役立つかどうかについての洞察を提供するために使用されます。 2つのモデルを推定し、それらのANOVAテーブルを生成すると、部分的なr ^ 2の計算は比較的簡単になります。部分的なr ^ 2の計算は次のとおりです。 (SSEreduced-SSEfull)/ SSEreduced 多重線形回帰モデルに対してこれを計算する、この比較的単純な関数を作成しました。私はこの関数が同様に機能しない可能性があるRの他のモデル構造に不慣れです: partialR2 <- function(model.full, model.reduced){ anova.full <- anova(model.full) anova.reduced <- anova(model.reduced) sse.full <- tail(anova.full$"Sum Sq", 1) sse.reduced <- tail(anova.reduced$"Sum Sq", 1) pR2 <- (sse.reduced - sse.full) / sse.reduced return(pR2) } このタスクを実行するためのより堅牢な機能および/または上記のコードのより効率的な実装に関する提案やヒントをいただければ幸いです。
9 r  regression  anova 

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

4
多元ノンパラメトリック分散分析
5つの因子(1つは別の因子にネストされている)と数値応答を含む要因計画を分析する必要があります。ノンパラメトリックANOVAを実行したいのですが、もちろんクラスカルウォリステストもフリードマンテストも使用できません(私は測定を複製しました)。Rに役立つコマンドまたはコードはありますか?ありがとうございました!ステファニア

1
反復測定anovaモデルと混合モデルの同等性:lmerとlme、および複合対称性
aov内部反復測定モデルとlmer混合モデルの間で同等の結果を取得するのに問題があります。 私のデータとスクリプトは次のようになります data=read.csv("https://www.dropbox.com/s/zgle45tpyv5t781/fitness.csv?dl=1") data$id=factor(data$id) data id FITNESS TEST PULSE 1 1 pilates CYCLING 91 2 2 pilates CYCLING 82 3 3 pilates CYCLING 65 4 4 pilates CYCLING 90 5 5 pilates CYCLING 79 6 6 pilates CYCLING 84 7 7 aerobics CYCLING 84 8 8 aerobics CYCLING 77 9 …


2
標本がANOVAまたはt検定には大きすぎることはありますか?
100万近くのデータセットがあり、平均比較検定(ANOVAまたはt検定)を実行するたびに、SPSSで.0001未満の有意水準が得られます。私のサンプルが非常に大きいので、もちろん、平均を比較すると、大幅に異なるものとして表示されることを心配しています。標本がANOVAまたはt検定には大きすぎることはありますか?

3
ANOVAの背後にある直感をどのように説明できますか?
ANOVAが非技術者に行っていることの背後にある直感について説明する必要があります。アイデアを説明するビジュアルはありますか?おそらく3つの因子レベルがある一元配置分散分析のコンテキストで主要なアイデアを説明するビジュアルは役立つでしょうか? その人が、過去に学生としていくつかの統計学のコースを受講したが、z検定の実行の詳細さえ忘れていたとしましょう。ただし、彼/彼女は、観察された効果がランダムな偶然によるものか、対象のパラメーターの実際の変化によるものかを確認するために仮説検定が使用されていることを覚えています。

5
ANCOVA in Rは異なるインターセプトを示唆していますが、95%のCIは重複しています…これはどのように可能ですか?
2つの共変量とカテゴリカルグループ化変数を含むデータセットがあり、異なるグループ化変数に関連付けられている共変量間で勾配または切片に有意差があるかどうかを知りたいと考えています。anova()とlm()を使用して、3つの異なるモデルの適合を比較しました:1)単一の勾配と切片、2)各グループの異なる切片、および3)勾配と各グループの切片。anova()の一般的な線形テストによると、2番目のモデルは3つのうち最も適切です。各グループに個別の切片を含めることにより、モデルに大幅な改善があります。ただし、これらのインターセプトの95%信頼区間を見ると、これらはすべて重複しており、インターセプト間に有意差がないことを示唆しています。これら2つの結果をどのように調整できますか?モデル選択法の結果を解釈する別の方法は、切片間に少なくとも1つの有意差がなければならないということであると考えましたが、おそらくこれは正しくありませんか? 以下は、この分析を再現するためのRコードです。dput()関数を使用しているので、取り組んでいるのとまったく同じデータを操作できます。 # Begin R Script # > dput(data) structure(list(Head = c(1.92, 1.93, 1.79, 1.94, 1.91, 1.88, 1.91, 1.9, 1.97, 1.97, 1.95, 1.93, 1.95, 2, 1.87, 1.88, 1.97, 1.88, 1.89, 1.86, 1.86, 1.97, 2.02, 2.04, 1.9, 1.83, 1.95, 1.87, 1.93, 1.94, 1.91, 1.96, 1.89, 1.87, 1.95, 1.86, 2.03, 1.88, 1.98, …

1
STFT統計分析
Rパッケージのevolfft関数を使用してRSEIS、信号のSTFT分析を行っています。 信号は1時間の長さで、3つの異なる条件、特に0-20 'コントロール、20'-40'刺激、40'-60 '刺激後に取得されました。 視覚的には、これらの3つの期間中にスペクトログラムに変化が見られます。治療中に周波数が高くなり、FFTパワーが増加しますが、「いくつかの数値を付ける」ために実行できる統計分析の種類があるかどうか疑問に思っていました。 なにか提案を? 編集:提案されたように、私が扱っているデータの例を追加します かなり広い周波数範囲でFFTのパワーが増加することがわかるように、処理は20 '〜40'の間です。実験ごとにこれらのSTFTが50〜60あります(合計10実験)。各実験のスペクトルを平均化しても、同様のタイプのパターンが得られます。さて、私の問題は、私が持っているデータをどのように正確に定量化し、治療前、治療中、治療後に比較する統計を作成するかです。

2
モデルを比較するための分散分析
RでのGAMに関するワークショップについては、このサイトを見ています。http://qcbs.ca/wiki/r_workshop8 セクションの最後に、3つの異なるモデルを比較して最適なモデルを決定するため2. Multiple smooth termsに使用する例を示しanovaます。出力は Analysis of Deviance Table Model 1: y ~ x0 + s(x1) Model 2: y ~ x0 + s(x1) + x2 Model 3: y ~ x0 + s(x1) + s(x2) Resid. Df Resid. Dev Df Deviance Pr(>Chi) 1 394.08 5231.6 2 393.10 4051.3 0.97695 1180.2 < …
9 r  anova  gam  mgcv 

3
ANOVAで等分散性の仮定に違反したときに発生する可能性がある最悪の事態は何ですか?
これは、この投稿を確認した後のフォローアップの質問です。違いは、非正規の異分散データの統計的検定を意味しますか? 明確にするために、私は実用的な観点から質問しています(理論的な応答が歓迎されないことを示唆するものではありません)。グループ間に正常性は存在しますが(上記の質問のタイトルとは異なります)、グループの差異が実質的に異なる場合、研究者が観察する可能性のある最悪の事態は何ですか? 私の経験では、このシナリオで最も発生する問題は、事後比較の「奇妙な」パターンです。(これは私の公開された作品と教育環境の両方で観察されています...以下のコメントでこれの詳細を提供してうれしいです。)私が観察したのはこれに似たものです: 3つのグループがあります。(オムニバス)ANOVAはを与え、ペアワイズ検定はが他の2つのグループと統計的に有意に異なることを示唆しています...しかしとM1&lt; M2&lt; M3M1&lt;M2&lt;M3M_1 < M_2 < M_3p &lt; αp&lt;αp<\alphatttM2M2M_2M1M1M_1M3M3M_3統計的に有意差はありません。私の質問の一部は、これが他の人が観察したものであるかどうかですが、比較可能なシナリオで他にどのような問題を観察しましたか? 私の参照テキストを簡単に確認すると、ANOVAは、等分散性の仮定の軽度から中程度の違反に対してかなり堅牢であり、サンプルサイズが大きい場合はさらに強固であることがわかります。ただし、これらのリファレンスでは、(1)何が問題になるか、または(2)多数のグループで何が発生するかを具体的に述べていません。

1
このデータに不正なフラグを立てますか?
4つの繰り返しと23の処理を含むランダム化されたブロック設計からいくつかのデータが与えられたとしましょう。データを最初に検査した後、8つの処理ですべての繰り返しが同一であることがわかりますが、これは明らかに誤りです。問題を報告した後、データの「正しいバージョン」を後で送信するデータの責任者からの混乱が原因であることが通知されます。データの修正バージョンは次のようになります。 治療担当者の値 A 1 5727.000 A 2 5400.000 A 3 5800.000 A 4 5473.000 B 1 4618.000 B 2 4844.000 B 3 4966.000 B 4 4496.000 ... Z 1 4329.345 Z 2 4597.275 Z 3 4833.246 Z 4 4199.098 そのようなデータで私の注意を引く最初のことは、問題が報告された8つの処理のみに小数部がないことです(残りの処理はすべて問題ありません)。したがって、私はそれらをより詳しく見て、処理内のサンプル平均から各観測値を差し引くことを決定し、次のようなものを見つけます 治療担当者値デルタ A 1 5727.000 +127 A 2 5400.000 -200 A …

2
反復測定ANOVAと主格因子による階乗ANOVA:aovの「エラーストラタ」とError()の用語を理解する
被験者内因子を1つ持つ反復測定ANOVA(RM-ANOVA)とA、各レベルの被験者ごとに複数の測定を検討しますA。 これは、2つの因子を備えた2因子ANOVAと密接に関連しAていsubjectます。:彼らは4つの部分に乗の和の同じ分解を使用しA、subject、A⋅subject、とresidual。ただし、双方向ANOVAはAのSSを残差SSと比較してAの効果をテストし、RM-ANOVAはAのSSをA主題相互作用SS と比較してAの効果をテストします。⋅⋅\cdot なぜ違いますか? この違いは、データの反復測定構造に自動的に従うのですか、それとも何らかの慣習ですか? 双方向ANOVAとRM-ANOVAのこの違いは、2つの異なるnullのテストに対応していますか?もしそうなら、それらは正確には何であり、なぜこれらの2つのケースで異なるnullを使用するのですか? 双方向ANOVAの検定は、2つのネストされたモデル(フルモデルとAなしのモデル)間のF検定として理解できます。RM-ANOVAも同様に理解できますか? (Aの各レベルの被験者ごとに測定値が1つしかない場合、A被験者と残差の変動を分解できないため、区別の種類は消えます:一方向反復測定ANOVAは双方向ANOVAと同等ですか?)⋅⋅\cdot デモンストレーション http://dwoll.de/rexrepos/posts/anovaMixed.htmlでd2生成されたおもちゃのデータを使用します。同じWebページに、RM-ANOVAの正しい構文が示されています。 # Discarding between-subject factors and leaving only one within-subject factor d = d2[d2$Xb1=='CG' &amp; d2$Xb2 == 'f', c(1,4,6)] (ペーストビンの再現可能なバージョンはこちらを参照してください。)データは次のようになります。 id Xw1 Y 1 s1 A 28.6 2 s1 A 96.6 3 s1 A 64.8 4 s1 B 107.5 5 s1 …

1
毛虫では、捕食者に対する抵抗力においてサイズよりも食事が重要ですか?
自然食(モンキーフラワー)を食べる毛虫が、人工食(小麦胚芽とビタミンの混合物)を食べる毛虫よりも捕食者(アリ)に対して耐性があるかどうかを調べています。小さなサンプルサイズで試験研究を行いました(20の幼虫、食事あたり10匹)。実験前に各キャタピラーの重量を量った。アリのグループに5分間、1組の毛虫(食事ごとに1つ)を提供し、各毛虫が拒否された回数をカウントしました。このプロセスを10回繰り返しました。 これは私のデータのようになります(A =人工食、N =自然食): Trial A_Weight N_Weight A_Rejections N_Rejections 1 0.0496 0.1857 0 1 2 0.0324 0.1112 0 2 3 0.0291 0.3011 0 2 4 0.0247 0.2066 0 3 5 0.0394 0.1448 3 1 6 0.0641 0.0838 1 3 7 0.0360 0.1963 0 2 8 0.0243 0.145 0 3 9 …
8 r  anova 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.