タグ付けされた質問 「multiple-comparisons」

複数の仮説検定が実行されたときに、意図されたパワーとサイズの達成が懸念される状況を示します。

3
オムニバステストと多重比較の関係は?
ウィキペディアは言う 多重比較に進む前に、オムニバステストに 依存するメソッド。通常、これらの方法では、複数の比較に進む前に重要なANOVA / Tukeyの範囲検定が必要です。これらのメソッドには、タイプIエラーの「弱い」制御があります。 また ANOVAのF検定は、モデルの全体的な有意性を検定するオムニバス検定の例です。有意なF検定とは、検定された平均のうち、少なくとも2つの平均が有意に異なることを意味しますが、この結果は、どの平均が互いに異なるかを正確に特定していません。実際、検定手段の違いは、2次有理F統計(F = MSB / MSW)によって行われました。どの平均が別の平均と異なるか、または平均のコントラストが有意に異なるかを判断するには、有意なオムニバスF検定を取得した後に、事後検定(多重比較検定)または計画検定を実行する必要があります。単純なBonferroni補正またはその他の適切な補正を使用することを検討してください。 したがって、全体的な有意性をテストするためにオムニバステストが使用されますが、多重比較は、どの違いが有意かを見つけることです。 しかし、私が正しく理解していれば、多重比較の主な目的は全体的な有意性をテストすることであり、どの差異が有意かを見つけることもできます。つまり、オムニバスと同じように多重比較を行うことができます。では、なぜオムニバステストが必要なのでしょうか。

2
3つのグループ間の比率を比較するために使用するテストはどれですか?
メールマーケティングキャンペーンをテストしています。最初のテストでは、2つの異なる種類の電子メールを送信し、電子メールを受信しない3番目のコントロールグループを用意しました。現在、アプリに戻ったユーザーの割合として「結果」が返されています。結果は次のとおりです。 Group | received e-mail | returned | %-returned A | 16,895 | 934 | 5.53% B | 17,530 | 717 | 4.09% C | 42408 | 1618 | 3.82% グループAは実際にはBやCよりも優れているようですが、これを示す適切なテストは何ですか?

1
ベイズの定理を使用する場合の信頼区間
いくつかの条件付き確率と、95%の信頼区間を計算しています。私のケースの多くでは、(分割表からの)試行からのx成功の単純なカウントがあるnため、で提供さbinom.confint(x, n, method='exact')れてRいるような二項信頼区間を使用できます。 しかし、他の場合では、そのようなデータがないので、ベイズの定理を使用して、持っている情報から計算します。たとえば、イベントおよび与えられた場合:baaabbb P(a | b )= P(B |)⋅ P(a )P(b )P(a|b)=P(b|a)⋅P(a)P(b) P(a|b) = \frac{P(b|a) \cdot P(a)}{P(b)} \ textrm {binom.confint}(\#\ left(b \ cap {} a)、\#(a)\ right)を使用してP(b | a)の周りの95%信頼区間を計算でき、比率P(a)/ P(b)を周波数比\#(a)/ \#(b)として。この情報を使用してP(a | b)の周囲の信頼区間を導出することは可能ですか?P(b | a )P(b|a)P(b|a)binom.confint(#(B ∩a )、#(a ))binom.confint(#(b∩a),#(a))\textrm{binom.confint}(\#\left(b\cap{}a),\#(a)\right)P(a )/ P(b )P(a)/P(b)P(a)/P(b)#(a )/#(b )#(a)/#(b)\#(a)/\#(b)P(a | b )P(a|b)P(a|b) ありがとう。

1
被験者ANOVA内で保護されたt検定を使用できないことを明確に述べている記事または本はどれですか。
保護された対応のあるサンプルのt検定を分析で使用するように依頼されました。要求者は、ペアのサンプルのt検定を実行するときに、被験者内のANOVA(1つの因子と4つのレベル)の全体的なMSeを使用しない場合、ANOVAからの保護は実際にはないことを述べています。 私が覚えているように、被験者間ANOVAでは、この手順は分散の均一性の仮定が満たされている場合にのみ防御できます。被験者内分散分析への拡張と思われるのは、球形性の違反がない場合にのみ許可されることです。このデータセットには違反があるため、球形性のHuynh-Feldt補正を適用することにしました。いずれにしても、このようなアプローチは分母の自由度を高めるため、保守的ではないと思われます。さらに、Rのpairwise.t.testのヘルプファイルには、「プーリングはペアのテストに一般化されていない」とあります。 私が計画した比較t検定の目的は、有意な分散分析をもたらした条件間の違いを識別することだけです。エラー分散のプールを拒否する理由を正当化したいのですが、そのようなアプローチが不適切であることを明確に示す引用を見つけることができません。誰か知っていますか?あるいは、なぜこの問題に対する私の考えが間違っているのですか?


2
このタイプの質問に対する正しい分析は何ですか?(条件付きロジスティック回帰?)
次の実験を踏まえて、以下の質問に答えるための正しい統計的方法は何ですか? 参加者は写真が連続して表示され、各写真の後にオブジェクトまたは顔のどちらを見たかに応答する必要があります。各試行(画像のプレゼンテーション)では、表示された画像(210の個別の顔の1つまたは210の個別のオブジェクトの1つ)に、一定量のランダムノイズ(5%から98%の間)が重ねられます。各トライアルで提示される画像はかなり小さいため、各トライアルにも背景があります。背景は黒、大きなオブジェクト、または大きな顔のいずれかです。個々の画像が一致します。つまり、個々の画像は合計3回表示されます。1回は黒い背景で、1回は大きなオブジェクトを背景として、1回は大きな顔を背景として表示されます。個々の画像に重ねられるランダムノイズの量は、3つの異なる背景条件にわたって一定に保たれます。大きなオブジェクトの背景にあるオブジェクトは変化せず、提示された210個の個別オブジェクト画像の1つに含まれていません。同様に、大きな顔の背景の顔は変化せず、表示される210個の個別の顔写真の1つには含まれません。背景にノイズは追加されません。 私が回答したいのは、3つの異なる背景条件間で、顔、オブジェクト、または両方の知覚が大きく異なるかどうかです。 回答したい質問の詳細については、下の質問5を参照してください つまり、最後に、次のようなデータテーブルがあります。 + ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- + | 参加者| カテゴリー| Pic ID | 騒音レベル| 背景| レスポンス* | + ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- + | 1 | 0 | 1 | …

1
従属比較の複数比較修正
で、このブログの記事の著者は同時に分位を推定し、全体の分位数機能をカバーして推定のために同時信頼エンベロープを構築する議論します。彼らはこれをブートストラップしてポイントワイズブートストラップ信頼区間を計算し、多重比較のためにボンフェローニ型補正を適用します。比較は独立していないので、式に従って独立した試行の有効数のようなものを計算します Ne q=N2Σ私、jr (b私、bj)Neq=N2∑i,jr(bi,bj)N_{eq}=\frac{N^2}{\sum_{i,j}r(b_i,b_j)} どこ NNN 推定するポイントの数であり、 r (b私、bj)r(bi,bj)r(b_i,b_j) 間のサンプル相関です 私はトンの時間ithith そして jjjthブートストラップベクトル。 私の質問は、この公式がどこから来たかです。それらはソースへのリンクを提供しますが、ソースにこの式は表示されません。この特定の修正が文献で使用されていることを知っている人はいますか?

2
テストモデルの仮定は、pハッキング/フィッシングと見なされますか?
こことここで説明されている「Pハッキング」、「フィッシング」、および「分岐パスの庭」は、偏った推定値を生成する調査を行う探索的データ分析のようなスタイルを示しています。 モデルの適合に使用されるのと同じデータセットで統計的検定を使用してモデルの仮定(たとえば、正規性、回帰のホモスケダスティシティ)をテストすることは、「p-ハッキング」または「分岐パスのガーデン」の問題と見なされますか? これらのテストの結果は、研究者が最終的にどのモデルに適合するかを決定するのに確かに影響します。

3
「複数のテストの修正」と「結合テスト」の何が問題になっていますか?
複数のテスト修正が「任意」であり、それらが以下の一貫性のない哲学に基づいていると言われているのはなぜでしょうか。 1つのステートメントの真実性は、他のどの仮説が楽しまれるかに依存します Bonferroniの調整の何が問題になっているのかなどの回答やコメントを参照してください。特に@FrankHarrellと@Bonferroniの間の議論。 (説明を簡単にするために)説明を簡単にするために、2つの(独立した)正規母集団があり、独立しており、標準偏差は既知であるが、手段は不明であると仮定します。(例として)これらの標準偏差がそれぞれであるとしましょう。。σ1=2,σ2=3σ1=2,σ2=3\sigma_1=2, \sigma_2=3 共同テスト 仮説H_0をテストしたいとします:\ mu_1 = 2 \&\ mu_2 = 2H0:μ1=2&μ2=2H0:μ1=2&μ2=2H_0: \mu_1 = 2 \& \mu_2=2対H_1:\ mu_1 \ ne 2 | \ mu_2 \ ne 2 \ alpha = 0.05のH1:μ1≠2|μ2≠2H1:μ1≠2|μ2≠2H_1: \mu_1 \ne 2 | \mu_2 \ne 2有意水準(記号\&は「and」を意味し、|は「or」を意味します)。α=0.05α=0.05\alpha=0.05&&\&||| また、最初の母集団からのランダムな結果x1x1x_1と2番目の母集団からのバツ2x2x_2があります。 場合真である最初確率変数及び第1我々は独立性を仮定したようにそれが保持しています確率変数は、。このを検定統計量として使用できます。観測された結果およびについて、が成り立つ場合、を受け入れH0H0H_0バツ1〜N(μ1= 2 、σ1= 2 )X1∼N(μ1=2,σ1=2)X_1 \sim N(\mu_1=2,\sigma_1=2)バツ2〜N(μ2= 2 、σ2= …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.