タグ付けされた質問 「multiple-comparisons」

複数の仮説検定が実行されたときに、意図されたパワーとサイズの達成が懸念される状況を示します。

2
グループ化されたペアを示すテーブルでテューキーHSD事後検定の結果を取得する方法
Rとの双方向のAnovaの後、TukeyHSD事後検定を実行して、有意差でグループ化されたソートされたペアを含むテーブルを取得したいと思います。(言い回しについては申し訳ありませんが、私はまだ統計に新しいです。) 私はこのようなものが欲しいです: だから、星や文字でグループ化。 何か案が?パッケージHSD.test()から関数をテストしましたが、agricolae双方向テーブルを処理していないようです。

4
ANCOVAでの事後テスト
質問: 共変量の効果を調整した後、グループ平均間の差の事後検定を行うための良い方法は何ですか? プロトタイプの例: 4つのグループ、グループごとに30人の参加者(たとえば、4つの異なる臨床心理学集団) 従属変数は数値です(インテリジェンススコアなど) 共変量は数値です(たとえば、社会経済的地位の指標) 研究の質問は、共変量を制御した後、従属変数でグループのペアが有意に異なるかどうかに関するものです。 関連する質問: 好ましい方法は何ですか? Rではどのような実装が利用可能ですか? 共変量が事後テストの実施手順をどのように変更するかについての一般的な参考文献はありますか?

3
研究者1は1000回の回帰を実行し、研究者2は1回のみを実行しますが、どちらも同じ結果になります。異なる推論を行う必要がありますか?
研究者がデータセットを調査しており、1000の異なる回帰を実行し、それらの間に1つの興味深い関係を見つけたとします。 ここで、同じデータ を持つ別の研究者がたった1つの回帰を実行し、他の研究者が1000の回帰を見つけて見つけたものと同じであることがわかります。研究者2は研究者1を知りません。 研究者1は研究者2とは異なる推論をすべきですか?どうして?たとえば、研究者1は多重比較補正を実行すべきですが、研究者2は実行すべきではありませんか? 研究者2が最初に単一の回帰を示した場合、どのような推測をしますか?その後、研究者1が結果を示した場合、推論を変更する必要がありますか?もしそうなら、なぜそれが重要なのでしょうか? PS 1:仮想の研究者について話すと問題が抽象化されるので、考えてみてください。利用可能な最良の方法を使用して、論文の回帰を1回だけ実行したと想像してください。次に、別の研究者が、あなたが実行したまったく同じ回帰が見つかるまで、同じデータで1000の異なる回帰を調査しました。二人は異なる推論をする必要がありますか?両方のケースで証拠は同じですか?他の研究者の結果を知っている場合、推論を変更する必要がありますか?公衆は2つの研究の証拠をどのように評価すべきですか? PS 2:可能であれば、具体的で、数学的/理論的な正当化を提供するようにしてください!

4
3つ以上のサンプル間の中央値の差に関する仮説検定
質問 3つのグループの人のテストスコアは、Rの個別のベクトルとして保存されます。 set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) これらのグループの中央値に大きな違いがあるかどうかを知りたいです。ウィルコクソン検定を使用して、グループ1とグループ2をテストできることを知っています。 wilcox.test(group1, group2) ただし、これは一度に2つのグループのみを比較するため、3つすべてを同時に比較したいと思います。0.05の有意水準でp値が得られる統計的検定が必要です。誰か助けてくれますか? 編集#1-ムードの中央値検定 ユーザーHibernatingの提案された答えに従って、Moodの中央値テストを試しました。 median.test <- function(x, y){ z <- c(x, y) g <- rep(1:2, c(length(x), length(y))) m …

2
適応シーケンシャル分析のp値の調整(カイ2乗検定の場合)?
私は、どの統計文献が次の問題に関連しているか、そしておそらくそれをどのように解決するかのアイデアを知りたいと思っています。 次の問題を想像してください。 一部の疾患には4つの治療法があります。どちらの治療がより良いかを確認するために、特別な試験を実施します。トライアルでは、被験者がいないことから始め、その後、1つずつ、より多くの被験者がトライアルに入力されます。各患者は、4つの可能な治療法のいずれかにランダムに割り当てられます。治療の最終結果は「健康」または「病気」であり、この結果をすぐに知ることができるとしましょう。つまり、任意の時点で、2 x 4の分割表を作成して、被験者の数がどの治療/最終結果に該当したかを示すことができます。 4つの可能な治療法の間に統計的に異なる治療法があるかどうかを確認するために、いつでも分割表を確認できます(たとえば、カイ2乗検定を使用)。それらのいずれかが他のすべてよりも優れている場合-トライアルを停止し、「勝者」として選択します。いくつかの試験が他の3つすべてよりも悪いことが示された場合、私たちは彼を試験から除外し、将来の患者への投与を停止します。 ただし、ここでの問題は、特定のポイントでテストを実行できること、テスト間に相関関係があること、プロセスの適応性がプロセスを操作することのためにp値をどのように調整するかですたとえば、何らかの治療が「悪い」と判明した場合)?

4
シダックまたはボンフェローニ?
私はSPSSの一般化線形モデルを使用して、16種類の植物の毛​​虫の平均数の違い(非正規、Tweedie分布を使用)を調べています。 複数の比較を実行したいのですが、SidakまたはBonferroniの補正テストを使用すべきかどうかわかりません。2つのテストの違いは何ですか?一方が他方より優れていますか?

1
累積データを繰り返しテストする際の全体的なタイプIエラー
グループシーケンシャルメソッドについて質問があります。 ウィキペディアによると: 2つの治療グループを使用したランダム化試験では、古典的なグループシーケンシャルテストが次の方法で使用されます。2つのグループを比較するために統計分析が実行され、対立仮説が受け入れられると、試験は終了します。それ以外の場合は、グループごとにn人の被験者がいる別の2n人の被験者に対して試験が継続されます。統計分析は、4nの被験者に対して再度実行されます。代替案が受け入れられた場合、トライアルは終了します。それ以外の場合、N個の2n被験者のセットが利用可能になるまで、定期的な評価を続けます。この時点で、最後の統計的検定が実施され、試験は中止されます しかし、この方法で累積データを繰り返しテストすることにより、タイプIのエラーレベルが増大します... サンプルが互いに独立している場合、全体のタイプIエラー、、だろうα⋆α⋆\alpha^{\star} α⋆=1−(1−α)kα⋆=1−(1−α)k\alpha^{\star} = 1 - (1 - \alpha)^k ここで、αα\alphaは各テストのレベル、は中間ルックの数です。kkk しかし、サンプルは重複しているため、独立していません。中間分析が等しい情報増分で実行されると仮定すると、次のことがわかります(スライド6) この表がどのように取得されるのか説明してもらえますか?


1
フィッシャーの厳密検定と超幾何分布
私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。 > soda_gender f m n 0 5 y 5 0 明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。 Rでフィッシャーの正確検定を実行すると、次の結果が得られます。 > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。 フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。 。この観察の可能性は何ですか?この質問に答えるために、次のコマンドを使用しました。 …

2
家族ごとのエラー境界:独立した質問のさまざまな研究でデータセットを再利用すると、複数のテスト問題が発生しますか
研究者のチームが特定のデータセットに対して複数の(仮説)テストを実行する場合、テストが独立していても、複数のテスト(Bonferroniなど)に対して何らかの修正を使用する必要があると主張する大量の文献があります。私の質問はこれです:この同じロジックは、同じデータセットで仮説をテストする複数のチームに適用されますか?別の言い方をすると、家族ごとの誤差計算の障壁は何ですか?研究者は探査のためだけにデータセットを再利用することに制限されるべきですか?

1
多重比較でいつp値を修正するのですか?
関連する質問が私の答えにならなかったと思います。2つ以上の分類子(機械学習)のパフォーマンスを評価します。Null仮説は、パフォーマンスは変わらないというものです。この仮説を評価するために、パラメトリック(ANOVA)テストとノンパラメトリック(Friedman)テストを実行します。それらが重要である場合、ポストホッククエストでどの分類子が異なるかを調べたいと思います。 私の質問は2つあります。 1)多重比較テスト後のp値の修正は必要ですか?「Alphafehler Kumulierung」のドイツ語版ウィキペディアサイトでは、同じデータに対して複数の仮説がテストされた場合にのみ問題が発生すると述べています。分類子(1,2)、(1,3)、(2,3)を比較すると、データは部分的にのみオーバーラップします。それでもp値を修正する必要がありますか? 2)P値補正は、t検定によるペアワイズ検定の後に使用されることがよくあります。Nemenyi(ノンパラメトリック)やTukeyのHSDテストなどの特殊な事後テストを行う場合にも必要ですか?この回答は、TukeyのHSDに「いいえ」と答えています。TukeyHSDテストは、複数の比較に対して正しいですか?。ルールはありますか、またはすべての潜在的な事後テストについてこれを調べる必要がありますか? ありがとう!

1
ノンパラメトリック検定での複数比較
ノンパラメトリックで12の処理があるデータセットを使用しています。クラスカル・ウォリス検定を実行して、有意な値を得ました。次に、多重比較手順を実行して、どの処理が大幅に異なるかを確認します。このトピックに関しては多くの情報がありますが、この問題に特に対処するものは何も見つかりませんでした。何か案は?? ppp

1
連続予測とカテゴリー予測の間の相互作用のための混合モデルの複数比較
lme4混合効果の回帰を当てはめmultcomp、ペアごとの比較を計算するために使用したいと思います。複数の連続したカテゴリカル予測子を含む複雑なデータセットがありますが、組み込みのChickWeightデータセットを例として使用して、私の質問を示すことができます。 m <- lmer(weight ~ Time * Diet + (1 | Chick), data=ChickWeight, REML=F) Time継続的でDietカテゴリー的(4レベル)であり、食事ごとに複数のひよこがあります。すべてのひよこはほぼ同じ体重で開始しましたが、餌は成長率に影響を与える可能性があるため、Diet切片は(多かれ少なかれ)同じでなければなりませんが、勾配は異なる場合があります。私はDietこのような切片効果のペアワイズ比較を得ることができます: summary(glht(m, linfct=mcp(Diet = "Tukey"))) そして、確かに、それらは大幅に異なっていませんが、Time:Diet効果の類似のテストをどのように行うことができますか?相互作用項を単にに入れるとmcpエラーが発生します。 summary(glht(m, linfct=mcp('Time:Diet' = "Tukey"))) Error in summary(glht(m, linfct = mcp(`Time:Diet` = "Tukey"))) : error in evaluating the argument 'object' in selecting a method for function 'summary': Error in mcp2matrix(model, linfct …

3
Pを形質転換するためのこれらの式は、正確な又は膨張/控えめな見積もりとしてLSD、MSD、SEへHSD、CI、
バックグラウンド 以前に公開されたデータを含むメタ分析を行っています。多くの場合、処理間の差異は、P値、最小有意差(LSD)、およびその他の統計で報告されますが、分散の直接的な推定値は提供されません。 私が使用しているモデルのコンテキストでは、分散の過大評価は問題ありません。 問題 これはへの変換のリストです。ここでS E = √SESESE(Saville 2003)私が検討していること、フィードバックは高く評価されています。以下、私は仮定するα=0.05ので、1- α / 2=0.975 及び変数は通常、特に明記しない限り、分散されています。SE=MSE/n−−−−−−−√SE=MSE/nSE=\sqrt{MSE/n} α=0.05α=0.05\alpha=0.051−α/2=0.9751−α/2=0.9751-^{\alpha}/_2=0.975 質問: 所与の、N、および処理手段ˉ X 1及びˉ X 2 S E = ˉ X 1 - ˉ X 2PPPnnnX¯1X¯1\bar X_1X¯2X¯2\bar X_2 SE=X¯1−X¯2t(1−P2,2n−2)2/n−−−√SE=X¯1−X¯2t(1−P2,2n−2)2/nSE=\frac{\bar X_1-\bar X_2}{t_{(1-\frac{P}{2},2n-2)}\sqrt{2/n}} αα\alphannnbbbbbbn=bn=bn=bSE=LSDt(0.975,n)2bn−−−√SE=LSDt(0.975,n)2bnSE = \frac{LSD}{t_{(0.975,n)}\sqrt{2bn}} nnnαα\alpha2n−22n−22n-2 SE=MSDt(0.975,2n−2)2–√SE=MSDt(0.975,2n−2)2SE = \frac{MSD}{t_{(0.975, 2n-2)}\sqrt{2}} αα\alphannn SE=CIt(α/2,n)SE=CIt(α/2,n)SE = \frac{CI}{t_{(\alpha/2,n)}} nnnqqqSE=HSDq(0.975,n)SE=HSDq(0.975,n)SE = \frac{HSD}{q_{(0.975,n)}} …

4
複数のカイ2乗検定
2 x 2 x 6の表に分類されたデータがあります。寸法responseをAと呼びましょうB。モデルを使用して、データにロジスティック回帰を適合させますresponse ~ A * B。そのモデルの逸脱の分析は、用語とその相互作用の両方が重要であることを示しています。 ただし、データの比率を見ると、Bこれらの重要な影響の原因となっているのはわずか2レベル程度です。どのレベルが犯人であるかを確認するためにテストしたいと思います。現在、私のアプローチは、2 x 2のテーブルで6つの2乗検定を実行しresponse ~ A、それらの検定からのp値を(ホルム調整を使用して)多重比較のために調整することです。 私の質問は、この問題へのより良いアプローチがあるかどうかです。より原理的なモデリング手法、または複数のカイ二乗検定比較手法はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.