タグ付けされた質問 「post-hoc」

「事後」とは、「アプリオリ」ではなく、データの収集後に決定される分析を指します。

1
lmerモデルに使用する多重比較方法:lsmeansまたはglht?
1つの固定効果(条件)と2つのランダム効果(被験者内のデザインとペアによる参加者)を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 次に、固定効果(条件)のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。 私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

2
グループ化されたペアを示すテーブルでテューキーHSD事後検定の結果を取得する方法
Rとの双方向のAnovaの後、TukeyHSD事後検定を実行して、有意差でグループ化されたソートされたペアを含むテーブルを取得したいと思います。(言い回しについては申し訳ありませんが、私はまだ統計に新しいです。) 私はこのようなものが欲しいです: だから、星や文字でグループ化。 何か案が?パッケージHSD.test()から関数をテストしましたが、agricolae双方向テーブルを処理していないようです。

5
非常に多数のデータポイントで値の代入を実行する方法は?
非常に大きなデータセットがあり、約5%のランダムな値が欠落しています。これらの変数は互いに相関しています。次のRデータセットの例は、ダミーの相関データを使用した単なるおもちゃの例です。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
シダックまたはボンフェローニ?
私はSPSSの一般化線形モデルを使用して、16種類の植物の毛​​虫の平均数の違い(非正規、Tweedie分布を使用)を調べています。 複数の比較を実行したいのですが、SidakまたはBonferroniの補正テストを使用すべきかどうかわかりません。2つのテストの違いは何ですか?一方が他方より優れていますか?

3
フリードマン検定後にネメニポストホック検定を正しく適用する方法
複数のデータセットで複数のアルゴリズムのパフォーマンスを比較しています。これらのパフォーマンス測定値が正規分布であることが保証されていないので、私はDemšar(2006)に基づいたNemenyi事後検定を伴うフリードマン検定を選択しました。 次に、Quad検定とそれに続くShaffer事後検定のような他の方法を提案する以外に、Nemenii検定を異なる方法で適用する別の論文を見つけました。 ネメニポストホックテストを正しく適用するにはどうすればよいですか? 1.スチューデント化範囲統計を使用しますか? Demšarの論文では、平均ランク差が付き臨界距離CDより大きい場合帰無仮説(2つのアルゴリズムのない性能差)を拒否すると言う CD=qαk(k+1)6N−−−−−−−√CD=qαk(k+1)6N CD = q_{\alpha}\sqrt{{k(k+1)}\over{6N}} 「臨界値qαは、スチューデント化された範囲統計を2–√.2.\sqrt{2}.」 掘り下げた後、特定のアルファについてそれらの "重要な値"を検索できることがわかりました。たとえば、α = 0.05の表α=0.05α=0.05\alpha = 0.05で、無限の自由度(各表の下部)を確認できます。 2.または正規分布を使用していますか? どうすればいいのかと思ったとき、正規分布のみを使用していたため、別の論文で混乱を招きました。デムサルは12ページで同様のことを述べています: z=(Ri−Rj)k(k+1)6N−−−−−√z=(Ri−Rj)k(k+1)6N z = {{(R_i − R_j)}\over{\sqrt{{k(k +1)}\over{6N}}}} αα\alphaαα\alpha この段落で彼はすべてのアルゴリズムを制御アルゴリズムと比較することについて話していましたが、「複数の比較を補正するために調整する方法が異なる」という発言は、これがネメニ検定にも当てはまることを示唆しています。 zzzk(k−1)/2k(k−1)/2k(k-1)/2 ただし、これにより、帰無仮説を棄却するための完全に異なるランク差が生じます。そして今、私は行き詰まっており、どの方法を適用すべきか分かりません。私は正規分布を使用する方に強く傾いています。正規分布を使用する方が簡単で論理的だからです。また、テーブルで値を検索する必要もありません。特定の重要度の値に拘束されません。 繰り返しになりますが、私はスチューデント化された範囲統計を扱ったことがないため、理解できません。

1
相互作用のある混合効果モデル(lme4)に対するmultcomp :: glhtの事後テスト
R(lme4パッケージ)の線形混合効果モデルで事後テストを実行しています。私が使用していmultcompたパッケージ(glht()事後テストを実行する機能)。 私の実験計画は、ランダムなブロック効果を伴う反復測定です。モデルは次のように指定されます。 mymod <- lmer(variable ~ treatment * time + (1|block), data = mydata, REML = TRUE) ここにデータを添付するのではなくwarpbreaks、multcompパッケージ内で呼び出されたデータを使用しています。 data <- warpbreaks warpbreaks$rand <- NA 「ブロック」効果を模倣するためにランダム変数を追加しました: warpbreaks$rand <- rep(c("foo", "bar", "bee"), nrow(warpbreaks)/3) これは私のモデルを模倣しています: mod <- lmer(breaks ~ tension * wool + (1|rand), data = warpbreaks) 「追加のMultcompの例-2 Way Anova」の例を知っています。この例では、のレベル内の緊張レベルを比較しますwool。 反対のことをしたい場合はどうなりますか?woolのレベル内のレベルを比較してtensionください (私の場合、これは、時間のレベル(3-6、7、8月)内の処理レベル(2-0、1)を比較することになります。 これを行うために次のコードを考え出しましたが、機能していないようです(以下のエラーメッセージを参照)。 …

2
3因子反復測定分散分析の有効な事後分析とは何ですか?
私は3因子反復測定ANOVAを実行しました。どのような事後分析が有効ですか? これは完全にバランスの取れた設計(2x2x2)であり、因子の1つに被験者内の反復測定があります。Rで反復測定ANOVAへの多変量アプローチを知っていますが、私の最初の本能は、ANOVAの単純なaov()スタイルを続行することです。 aov.repeated <- aov(DV ~ IV1 * IV2 * Time + Error(Subject/Time), data=data) DV =応答変数 IV1 =独立変数1(2レベル、AまたはB) IV2 =独立変数2(2レベル、はいまたはいいえ) IV3 =時間(2レベル、前または後) 被験者=被験者ID(合計40被験者、IV1の各レベルに対して20:nA = 20、nB = 20) summary(aov.repeated) Error: Subject Df Sum Sq Mean Sq F value Pr(>F) IV1 1 5969 5968.5 4.1302 0.049553 * IV2 1 3445 3445.3 2.3842 …

2
混合効果モデルとの相互作用項で事後比較を実行するにはどうすればよいですか?
堆積物の微生物活動に対する乾燥の影響を評価するために、データセットを作成しています。目的は、乾燥の影響が堆積物の種類や堆積物内の深さによって異なるかどうかを判断することです。 実験計画は次のとおりです。 最初の要素の堆積物は、3種類の堆積物(コード化されたSed1、Sed2、Sed3)に対応します。堆積物の種類ごとに、3つのサイト(Sed1の3サイト、Sed2の3サイト、Sed3の3サイト)でサンプリングが行われました。 サイトはコード化されています:Site1、Site2、...、Site9。 次の要素は水文学です。各サイト内で、サンプリングはドライプロットとウェットプロット(コードされたドライ/ウェット)で実行されます。 上記の各プロット内で、サンプリングは2つの深度(D1、D2)で3 回実行されます。 合計n = 108サンプル= 3堆積物* 3サイト* 2水文学* 2深度* 3反復があります。 私lme()はR の関数(nlmeパッケージ)を次のように使用します。 Sediment <- as.factor(rep(c("Sed1","Sed2","Sed3"),each=36)) Site <- as.factor(rep(c("Site1","Site2","Site3","Site4","Site5", "Site6","Site7","Site8","Site9"),each=12)) Hydrology <- as.factor(rep(rep(c("Dry","Wet"),each=6),9)) Depth <- as.factor(rep(rep(c("D1","D2"),each=3),18)) Variable <- rnorm(108) mydata <- data.frame(Sediment,Site,Hydrology,Depth,Variable) mod1 <- lme(Variable ~ Sediment*Hydrology*Depth, data=mydata, random=~1|Site/Hydrology/Depth) anova(mod1) 事後比較を実行して、用語が重要かどうかをテストします。 簡単な主な効果(たとえば、堆積物)のためにそれを行うことができます。 summary(glht(mod1,linfct=mcp(Sediment="Tukey"))) ただし、このglht()関数は交互作用項では機能しません。 私は次のことが2ウェイanovaで機能することを発見しました: mod1 …

3
母集団のr二乗変化の信頼区間を取得する方法
簡単な例のために、2つの線形回帰モデルがあると仮定します モデル1は、3つの予測因子を持っているx1a、x2bと、x2c モデル2には、モデル1からの3つの予測子と2つの追加の予測子がx2aあり、x2b 母集団の分散が説明人口回帰式がある モデル1及びρ 2 (2 )増分分散がある集団におけるモデル2によって説明するモデル2についてΔは、ρ 2 = ρ 2 (2 ) - ρ 2 (1 )ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δρ2=ρ2(2)−ρ2(1)Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} 私は、の推定のための標準誤差と信頼区間を得ることに興味を持ってい。例にはそれぞれ3および2の予測子が含まれていますが、私の研究対象は、さまざまな数の予測子(たとえば、5および30)に関係しています。私が最初に考えたのは使用していた Δ R 2 、A D J = R 2 のD J (2 ) - R 2 次元J (1 )推定量として、それをブートストラップが、私は確かに、これは適切であるかどうかではなかったです。Δρ2Δρ2\Delta\rho^2Δr2adj=r2adj(2)−r2adj(1)Δradj2=radj(2)2−radj(1)2\Delta r^2_{adj} = r^2_{adj(2)} - r^2_{adj(1)} ご質問 されたの合理的な推定量Δは、ρ …

1
それはすべて家族の中にあります。しかし、私たちは義理の人も含めますか?
2つ以上の要因を含む実験があるとします。全体的なANOVAが構築され、その後、複数の比較を行うなど、2つ以上の事後テストのセットでフォローアップします。私の質問は、これらの事後テストの多重度調整の基礎として使用する家族の数と数についてです。 例としては、EDAに関するTukeyの本のwarp-breaksデータセットがあります。wool(2つのレベルで)とtension(3つのレベルで)の2つの要因があります。分散分析表は次のとおりです。 Source Df Sum Sq Mean Sq F value Pr(>F) wool 1 450.7 450.67 3.7653 0.0582130 tension 2 2034.3 1017.13 8.4980 0.0006926 wool:tension 2 1002.8 501.39 4.1891 0.0210442 Residuals 48 5745.1 119.69 明らかに、モデルには相互作用が必要です。そこで、他の因子を固定したまま、各因子のレベルの比較を行うことにします。結果は以下のとおりですが、いくつかの注釈は後で参照されます。 *** Pairwise comparisons of tension for each wool *** *** All combined: Family T *** wool …

4
マンホイットニー検定をクラスカル・ウォリス後の事後比較に使用できますか?
動物が敵対的な環境に置かれ、生存のためのいくつかのアプローチを使用してどのくらいの期間生き残ることができるかをシミュレーションするシミュレーションがあります。それが生き残るために使用できる3つのアプローチがあります。私は、各生存アプローチを使用して、動物のシミュレーションを300回実行しました。すべてのシミュレーションは同じ環境で行われますが、ランダム性があるため、毎回異なります。各シミュレーションで動物が生存する秒数を計測します。長生きすることは良いことです。私のデータは次のようになります: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these この時点以降に何をするかわからないので、私が愚かで間違っていることをしているのかどうかを知らせてください。特定のアプローチを使用して、寿命に統計的な違いがあるかどうかを調べようとしています。 各サンプルに対してShapiroテストを実行したところ、小さなp値が返されたため、データが正規化されていないと思います。 行のデータは互いに関係がありません。各シミュレーションに使用されるランダムシードは異なりました。その結果、データがペアになっていないと思います。 データが正規化されておらず、ペアになっておらず、サンプルが3つ以上あるため、クラスカルウォリス検定を実行しました。p値は0.048でした。次に、ポストホックに移り、Mann Whitneyを選択しました。マンホイットニーをここで使用する必要があるかどうかは本当にわかりません。 マンホイットニー検定、つまり{(アプローチ1、アプローチ2)、(アプローチ1、アプローチ3)、(アプローチ2、アプローチ3)}を実行して、各生存アプローチを互いに比較しました。両側検定を使用してペア(アプローチ2、アプローチ3)の間に統計的有意性の所見はありませんでしたが、片側検定を使用して有意差が見つかりました。 問題: このようにマンホイットニーを使用することが理にかなっているかどうかはわかりません。 私は片側または両側のマンホイットニーを使用する必要があるかどうかわかりません。

1
Tukey HSDテストは、t.testの未補正のP値よりもどのように重要ですか?
私は、「二元配置分散分析の事後的なペアワイズ比較」という投稿(この投稿に対応する)を見つけました。 dataTwoWayComparisons <- read.csv("http://www.dailyi.org/blogFiles/RTutorialSeries/dataset_ANOVA_TwoWayComparisons.csv") model1 <- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) summary(model1) # Treatment is signif pairwise.t.test(dataTwoWayComparisons$StressReduction, dataTwoWayComparisons$Treatment, p.adj = "none") # no signif pair TukeyHSD(model1, "Treatment") # mental-medical is the signif pair. (出力はジャバラ付属) ペアになっている(調整されていないp値)t検定が失敗したときに、Tukey HSDが有意なペアを見つけることができる理由を誰かが説明できますか? ありがとう。 これがコード出力です > model1 <- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) > summary(model1) # Treatment is signif Df Sum …

3
Pythonのフリードマンテストと事後テスト
私のデータセットには、x量の測定値を持つ5つの(通常の)グループがあります。等分散性に違反しているため、グループ間に統計的差異があるかどうかを確認するためにフリードマンカイ2乗検定を実行しました。 fried = stats.friedmanchisquare(*[grp for idx, grp in df.iteritems()])) これは統計的な差を返しましたが、次に、どのグループ間に差が存在するのかを調べたいと思います。これRには素晴らしい解決策があります(フリードマンのテストと事後分析、https://www.r-statistics.com/2010/02/post-hoc-analysis-for-friedmans-test-r-code/) 、Wilcoxon-Nemenyi-McDonald-Thompsonテストを使用していますが、Python用のテストを見つけることができません。 フリードマン検定の事後分析を行う可能性はありますか?別の方法として、グループ間の比較を可能にするフリードマン検定(たとえば、一般化された推定方程式)の良い代替手段は何でしょうか。

1
多くのグループとの複数の比較
複数の比較テストを使用することが私のデータに適しているかどうかを判断したいと思います。クラスカルウォリス検定を使用して、異なるグループ間で平均阻害に差があるかどうかを判断しました。分析の結果、有意差があることがわかりました。次に、多重比較手順(おそらく、サンプルサイズが異なるのでDunnのもの)を使用して、他のグループと異なるグループを確認します。171717 私は多くのグループ()を持っているので、これは多重比較テストの能力がほとんどないか、このデータセットに対して実行するのに適切ではないのかと思っていました。k = 17k=17k = 17

2
Rの2因子反復測定ANOVA後の事後検定?
Rで2因子(両方とも被験者内)のANOVAを繰り返し測定した後、事後テスト(Tukey HSD)を実行する方法に関する解決策を見つけるのに問題があります。ANOVAには、aov -functionを使用しました。 summary(aov(dv ~ x1 * x2 + Error(subject/(x1*x2)), data=df1)) 他の質問への回答を読んだ後、他の機能(lmeなど)を使用してANOVAを再実行する必要があることを知りました。これが私が思いついたものです。 Lme.mod <- lme(dv ~ x1*x2, random=list(subject=pdBlocked(list(~1, pdIdent(~x1-1), pdIdent(~x2-1)))), data=df1) anova(Lme.mod) 主な効果はどちらも有意でしたが、相互作用の効果はありませんでした。次に、これらの関数を事後比較に使用しました。 summary(glht(Lme.mod, linfct=mcp(x1="Tukey"))) summary(glht(Lme.mod, linfct=mcp(x2="Tukey"))) しかし、いくつかの問題がありました: まず、Rヘルプファイルには、「双方向ANOVAまたはANCOVAモデル(...)multcompバージョン1.0-0以降で対象のパラメーターを定義する場合、mcp関数は注意して使用する必要があります。主な効果の比較が生成されます。のみ、共変量と交互作用を無視します(古いバージョンは交互作用項で自動的に平均化されました)警告が表示されます。そして確かに、私は次の警告メッセージを受け取りました: Warning message: In mcp2matrix(model, linfct = linfct) : covariate interactions found -- default contrast might be inappropriate もう1つの不可解な点は、両方の主要な効果は有意でしたが、要因の1つ(x1)の事後比較に有意差はなかったということです。これに出会ったことはありません。スクリプト/分析は正しい/適切ですか、それとも欠けているものはありますか?どんな助けでも大歓迎です!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.