タグ付けされた質問 「multiple-comparisons」

複数の仮説検定が実行されたときに、意図されたパワーとサイズの達成が懸念される状況を示します。

3
フリードマン検定後にネメニポストホック検定を正しく適用する方法
複数のデータセットで複数のアルゴリズムのパフォーマンスを比較しています。これらのパフォーマンス測定値が正規分布であることが保証されていないので、私はDemšar(2006)に基づいたNemenyi事後検定を伴うフリードマン検定を選択しました。 次に、Quad検定とそれに続くShaffer事後検定のような他の方法を提案する以外に、Nemenii検定を異なる方法で適用する別の論文を見つけました。 ネメニポストホックテストを正しく適用するにはどうすればよいですか? 1.スチューデント化範囲統計を使用しますか? Demšarの論文では、平均ランク差が付き臨界距離CDより大きい場合帰無仮説(2つのアルゴリズムのない性能差)を拒否すると言う CD=qαk(k+1)6N−−−−−−−√CD=qαk(k+1)6N CD = q_{\alpha}\sqrt{{k(k+1)}\over{6N}} 「臨界値qαは、スチューデント化された範囲統計を2–√.2.\sqrt{2}.」 掘り下げた後、特定のアルファについてそれらの "重要な値"を検索できることがわかりました。たとえば、α = 0.05の表α=0.05α=0.05\alpha = 0.05で、無限の自由度(各表の下部)を確認できます。 2.または正規分布を使用していますか? どうすればいいのかと思ったとき、正規分布のみを使用していたため、別の論文で混乱を招きました。デムサルは12ページで同様のことを述べています: z=(Ri−Rj)k(k+1)6N−−−−−√z=(Ri−Rj)k(k+1)6N z = {{(R_i − R_j)}\over{\sqrt{{k(k +1)}\over{6N}}}} αα\alphaαα\alpha この段落で彼はすべてのアルゴリズムを制御アルゴリズムと比較することについて話していましたが、「複数の比較を補正するために調整する方法が異なる」という発言は、これがネメニ検定にも当てはまることを示唆しています。 zzzk(k−1)/2k(k−1)/2k(k-1)/2 ただし、これにより、帰無仮説を棄却するための完全に異なるランク差が生じます。そして今、私は行き詰まっており、どの方法を適用すべきか分かりません。私は正規分布を使用する方に強く傾いています。正規分布を使用する方が簡単で論理的だからです。また、テーブルで値を検索する必要もありません。特定の重要度の値に拘束されません。 繰り返しになりますが、私はスチューデント化された範囲統計を扱ったことがないため、理解できません。

1
Holm-Bonferroniテストの信頼区間は?
私は多重比較の問題の新人です。Holm-Bonferroni法の信頼区間を計算する方法を知りたいのですが。 私はボンフェローニ法に私達はちょうどからの信頼レベルを変更することができることを知っているする1 - αを1−α1−α1-\alpha。1−αm1−αm1-\frac{\alpha}{m} この方法はHolm-Bonferroniでも機能しますか? HBメソッドは設定を修正する手順を提供していないようです。間隔。しかし、p値の補正に1つの方法を使用し、間隔の補正に別の方法を使用できるかどうかについてコメントしていただけますか?Edit:Edit:\bf{Edit}:

1
Local Moran's I統計量(LISA)のp値調整
私はspdepパッケージを使用して、Rでいくつかの探索的空間分析を行っています。 関数を使用して計算された空間的関連のローカルインジケーター(LISA)のp値を調整するオプションを見つけましたlocalmoran。ドキュメントによると、それは目的としている: ...複数のテストの確率値調整。 さらにp.adjustSP私が読んだドキュメントでは、利用可能なオプションは次のとおりです: 調整方法には、p値に比較回数を掛けるBonferroni補正( '"bonferroni"')が含まれます。Holm(1979)( '"holm"')、Hochberg(1988)( '"hochberg"')、Hommel(1988)( '"hommel"')およびBenjamini&Hochberg(1995)には、保守性の低い4つの修正も含まれています。 ( '"fdr"')、それぞれ。パススルーオプション( '"none"')も含まれています。 最初の4つの方法は、家族ごとのエラー率を強力に制御できるように設計されています。変更されていないBonferroni補正を使用する理由はないようです。これは、Hormの方法が支配的であるため、任意の仮定の下でも有効です。 Hochberg法とHommel法は、仮説検定が独立している場合、またはそれらが非負に関連している場合に有効です(Sarkar、1998; SarkarおよびChang、1997)。Hommelの方法はHochbergの方法よりも強力ですが、通常、差は小さく、Hochbergのp値の計算は高速です。 Benjamini、Hochberg、およびYekutieliの "BH"(別名 "fdr")および "BY"メソッドは、偽の発見率を制御します。これは、棄却された仮説の中で予想される偽の発見の割合です。誤検出率は、ファミリごとのエラー率よりも厳格ではないため、これらの方法は他の方法よりも強力です。 現れたいくつかの質問: 簡単に言えば、この調整の目的は何ですか? そのような修正を使用する必要がありますか? はいの場合-利用可能なオプションから選択する方法は?

2
多重回帰と多重比較
たとえば、p個の説明変数の重回帰を当てはめたとします。t検定により、これらのいずれか1つが有意であるかどうかを確認できます()。部分的なF検定を実行して、それらの一部のサブセットが有意であるかどうかを確認できます()。H0:βi=0H0:βi=0H_0: \beta_i = 0H0:βi=βj=...=βk=0H0:βi=βj=...=βk=0H_0: \beta_i=\beta_j=...=\beta_k=0 しかし、私がよく目にするのは、誰かが5つのt検定から5つのp値を取得し(共変量が5であると仮定)、p値が0.05未満のものだけを保持することです。多重比較チェックが実際にあるはずなので、それは少し間違っているようです?やようなものは重要だが、、、ははないと言うのは本当に公平ですか?β1β1\beta_1β2β2\beta_2β3β3\beta_3β4β4\beta_4β5β5\beta_5 関連するメモとして、2つの別々のモデルで2つの回帰を実行するとします(異なる結果)。2つの結果の間の重要なパラメーターの多重比較チェックが必要ですか? 編集: 同様の質問と区別するために、「B_iは他のすべての共変量を調整するときに有意である」以外に、p値に対する他の解釈はありますか?この解釈では、すべてのB_iを調べて、0.5未満のB_iを削除できるようには思えません(これは他の投稿と同様です)。 B_iとYに関係があるかどうかをテストする確実な方法は、各共変量の相関係数のp値を取得してから、multcompを実行することです(ただし、信号は確実に失われます)。 最後に、B1 / Y1、B2 / Y1とB3 / Y1(したがって3つのp値)の間の相関を計算したとしましょう。無関係に、T1 / Y2、T2 / Y2、T3 / Y2の間の相関も行いました。正しいBonferroni調整は6つのテストすべてで6になると想定しています(最初のグループでは3つ、2番目のグループでは3ではなく、2つの「半」調整されたp値が得られます)。

2
複数の比較のための階層モデル-複数の結果のコンテキスト
私は、(通常)多重比較を心配する必要がない(通常) Gelmanの(再)を読んだばかりです。特に、「複数の結果とその他の課題」のセクション では、同じ人物/ユニットからの複数の関連する測定が異なる時間/条件である場合の階層モデルの使用について言及しています。それは多くの望ましい特性を持っているようです。 これは必ずしもベイジアンのものではないことを理解しています。誰かがrjagsやlmer(通常のJAGSやBUGSだけでなく、MCMCglmmなどの他の混合モデルライブラリも問題ないはずです)を使用して多変量マルチレベルモデルを適切に構築する方法を教えてくれます。対照的な結果?モデルが欲しい状況のタイプは、以下のおもちゃのデータ(多変量、反復測定)に反映されています。 set.seed(69) id <- factor(rep(1:20, 2)) # subject identifier dv1 <- c(rnorm(20), rnorm(20, 0.8, 0.3)) # dependent variable 1 data for 2 conditions dv2 <- c(rnorm(20), rnorm(20, 0.3, 0.6)) dv3 <- c(rnorm(20), rnorm(20, -0.3, 0.8)) dv4 <- c(rnorm(20), rnorm(20, 0.2, 1 )) dv5 <- c(rnorm(20), rnorm(20, 0.5, …

3
相関行列の相関の統計的有意性を示す相関係数のしきい値
各データポイントが14の特性を含む455のデータポイントを含むデータセットの相関行列を計算しました。したがって、相関行列の次元は14 x 14です。 これらの2つの特性の間に有意な相関があることを示す相関係数の値にしきい値があるかどうか疑問に思っていました。 私は-0.2から0.85の範囲の値を持っています、そして私は重要なものは0.7を超えるものであると考えていました。 しきい値と見なす必要がある相関係数の一般的な値はありますか、それとも、調査しているデータタイプに依存しているだけですか?

2
時系列セットの比較
比較したい3つの時系列データセットがあります。彼らは約12日間の3つの別々の期間に服用されています。これらは、最終週に大学図書館で受けた平均人数、最大人数、最小人数です。時間あたりの人数が連続していないため、平均、最大、最小を実行する必要がありました(時系列の定期的なデータギャップを参照)。 データセットは次のようになります。12夜の場合、夜ごとに1つのデータポイント(平均、最大、または最小)があります。データが取得されたのは3学期で、12日間の懸念期間のみです。したがって、たとえば、2010年春、2010年秋、および2011年5月には、それぞれ12ポイントのセットがあります。以下はチャートの例です。 学期ごとにパターンがどのように変化するかを見たいので、私は学期を重ねました。ただし、リンク先のスレッドで説明したように、中間にデータがないため、学期を完全に平手打ちすることはお勧めできません。 問題は、次のとおりです。各学期の出席パターンを比較するためにどのような数学的手法を使用できますか? 私がしなければならない時系列に特別なことはありますか、それとも単純にパーセントの差をとることができますか?私の目標は、最近のライブラリの使用量が増加または減少していると言うことです。それを示すためにどのテクニックを使用すればよいかわからない。


1
同じデータセットで2つの線形モデルを実行することは許容されますか?
複数のグループ(自然なグループが事前に定義されたもの)の線形回帰の場合、次の2つの質問に答えるために、同じデータセットで2つの異なるモデルを実行することは許容できますか? 各グループには非ゼロの勾配と非ゼロの切片がありますか?グループ回帰内の各パラメーターは何ですか? グループメンバーシップに関係なく、非ゼロの傾向と非ゼロの切片はありますか?グループ全体の回帰のパラメーターは何ですか? Rでは、最初のモデルはでありlm(y ~ group + x:group - 1)、推定された係数は各グループの切片と勾配として直接解釈できます。2番目のモデルはですlm(y ~ x + 1)。 代替案はlm(y ~ x + group + x:group + 1)、であり、これにより、係数の複雑な要約表が得られ、グループ内の勾配と切片は、いくつかの参照からの勾配と切片の差から計算する必要があります。また、最後のグループの差異(場合によっては)のp値を取得するために、グループを並べ替えてモデルをもう一度実行する必要があります。 これは2つの別個のモデルを使用して、推論に何らかの悪影響を及ぼしますか、またはこの標準的な方法に悪影響を及ぼしますか? これをコンテキストに入れるために、xを薬物の投与量と見なし、グループを異なる人種と見なします。医師の特定の人種、または薬剤が効く人種の用量反応関係を知ることは興味深いかもしれませんが、(ヒト)母集団全体の用量反応関係を知ることも興味深い場合があります公衆衛生担当官の人種に関係なく。これは、グループ内とグループ全体の両方の回帰に個別に関心を持つ方法の単なる例です。用量反応関係が線形であるべきかどうかは重要ではありません。

2
どのようにテストするかどうかを
平均して、私は、3つの独立したグループがあるとμ1、μ 2、μ 3μ1, μ2, μ3\mu_1,~ \mu_2,~\mu_3それぞれ。 どのようにしてテストすることができるかどうかをμ1&lt; μ2&lt; μ3μ1&lt;μ2&lt;μ3\mu_1 < \mu_2 <\mu_3、または使用していないん1、n 2、n 3n1, n2, n3n_1,~n_2,~n_3、各グループからのサンプル? 詳細な計算ではなく、一般的な方法論を知りたい。仮説H0H0H_0とH1H1H_1設定方法がわかりませんでした。

1
高次元の相関データと上位の特徴/共変量が発見されました。複数の仮説検定?
約5,000の相関関係のある特徴/共変量とバイナリ応答のデータセットがあります。データは私に与えられました、私はそれを集めませんでした。ラッソとグラディエントブースティングを使用してモデルを構築しています。私は反復されたネストされた相互検証を使用しています。Lassoの最大(絶対)40係数と、勾配ブーストツリーの40の最も重要な機能を報告します(40について特別なことは何もありませんでした。これは、妥当な量の情報であるように思われました)。また、CVのフォールドと反復におけるこれらの量の分散についても報告します。 私は「重要な」機能について少し考え、p値や因果関係などについては何も述べていませんが、代わりにこのプロセスをある種の---不完全でランダムなものである-何らかの現象への洞察と見なしています。 私がこれをすべて正しく行ったと仮定すると(たとえば、相互検証を正しく実行し、投げ縄用にスケーリングした)、このアプローチは妥当ですか?たとえば、複数の仮説検定、事後分析、誤った発見などの問題はありますか?または他の問題? 目的 有害事象の確率を予測する まず、正確に確率を推定する よりマイナー-健全性チェックとしてだけでなく、さらに調査できるいくつかの新しい予測子を明らかにするために、上記のように係数と重要性を検査します。 消費者 このイベントの予測に関心のある研究者、およびイベントが発生した場合にイベントを修正する必要のある人々 彼らがそれから抜け出してほしいもの 説明されているように、独自のデータを使用してモデリングプロセスを繰り返したい場合は、イベントを予測する機能を提供します。 予想外の予測因子に光を当てる。たとえば、完全に予期しないことが最良の予測因子であることが判明する場合があります。したがって、他の場所のモデラーは、この予測子をより真剣に検討するかもしれません。

1
それはすべて家族の中にあります。しかし、私たちは義理の人も含めますか?
2つ以上の要因を含む実験があるとします。全体的なANOVAが構築され、その後、複数の比較を行うなど、2つ以上の事後テストのセットでフォローアップします。私の質問は、これらの事後テストの多重度調整の基礎として使用する家族の数と数についてです。 例としては、EDAに関するTukeyの本のwarp-breaksデータセットがあります。wool(2つのレベルで)とtension(3つのレベルで)の2つの要因があります。分散分析表は次のとおりです。 Source Df Sum Sq Mean Sq F value Pr(&gt;F) wool 1 450.7 450.67 3.7653 0.0582130 tension 2 2034.3 1017.13 8.4980 0.0006926 wool:tension 2 1002.8 501.39 4.1891 0.0210442 Residuals 48 5745.1 119.69 明らかに、モデルには相互作用が必要です。そこで、他の因子を固定したまま、各因子のレベルの比較を行うことにします。結果は以下のとおりですが、いくつかの注釈は後で参照されます。 *** Pairwise comparisons of tension for each wool *** *** All combined: Family T *** wool …

4
多くの肯定的で重要でない結果がある場合、「これらの結果のうち少なくともが肯定的」であることをテストできますか?
100人の異なる個人に対して同じ回帰を別々に実行したとしましょう。私の関心のある係数は正です(そして互いにかなり異なります)が、100の結果すべてで統計的に重要ではありません(すべてのp値= 0.11としましょう)。 これらのp値を組み合わせて、「これらの結果の少なくとも80が正である」とp = 0.11よりも有意性があると結論付ける方法はありますか?私のオンライン検索では、「これらの結果の少なくとも1つが陽性である」とフィッシャーまたは同様のテストで言う方法を示しただけですが、その結果を一般化することはできませんでした。「H0 = 100のすべての効果が0で同じである」に対して、「HA =少なくとも80の効果が陽性」に対してテストしたい。 私の目標は、平均して正の係数があると言うことではなく、係数を具体的に測定することでもありません。私の目標は、少なくとも80人がそれぞれの80に関係なく、また各個人が感じる影響の大きさに関係なく、個々に何らかのプラスの影響に直面したことを、有意義に示すことです。

2
Benjamini-Hochberg依存関係の仮定は正当化されますか?
約50の異なる変数に関して3つの母集団間の有意差をテストするデータセットがあります。これは、一方でKruskal-Wallis検定を使用し、もう一方では、入れ子のGLMモデルフィット(独立変数としての人口の有無にかかわらず)の尤度比検定によって行います。 その結果、一方ではクラスカル・ウォリスの値のリストがあり、もう一方ではLRT比較からのカイ2乗のp値だと思います。pppppp &gt; 50の異なるテストがあるため、いくつかの形式の複数のテスト修正を行う必要があります。Benjamini-HochbergFDRが最も賢明な選択のようです。 ただし、変数はおそらく独立しておらず、それらのいくつかの「氏族」が相関しています。問題はそれです:私の値の基礎となる統計のセットが、Benjamini-HochbergプロシージャがFDRに引き続きバインドされるために必要な正の依存性の要件を満たしているかどうかはどうすればわかりますか?ppp 2001年のBenjamini-Hochberg-Yekutieli論文では、PRDS条件は多変量正規分布とスチューデント化分布に当てはまると述べています。モデル比較のための尤度比検定のカイ二乗値はどうですか?クラスカル・ウォリス検定の値はどうなりますか?ppp 依存関係に何も仮定しないBenjamini-Hochberg-Yekutieliの最悪の場合のFDR補正を使用できますが、この場合は保守的すぎるため、いくつかの関連する信号を見落とす可能性があります。

1
ステージでの偽発見率の制御
サイズは 3次元テーブルを持っています。表の各セルは仮説検定です。テーブルを3次元でスライスすると、81セットの仮説検定が生成されます。これは、セット間で独立していますが、セット内で依存しています。もともと私は、すべての仮説テストで同時にBenjamini-Hochberg手順を使用して、誤った発見率を制御できると考えていました。それはこの問題を攻撃するための合理的な方法ですか?私の2番目の考えは、テーブルの3番目の次元に沿った各スライス内の誤検出率を制御し、その後、他の種類の修正を適用することです。誰かがこの種の手順についてもっと情報を持っていますか?6×6×816×6×816\times6\times81818181

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.