回答:
2つのメトリックが1)バイナリと2)ヘビーテールであることを考えると、正規分布を仮定するt検定を避ける必要があります。
Mann-Whitney Uが最良の選択であり、たとえ分布がほぼ正常であったとしても十分に効率的であると思います。
2番目の質問について:
1つのテストでコホート間の有意差が示唆され、他のテストで有意差がないことが示唆された場合はどうなりますか?
統計的な差異が境界線であり、データに「乱雑な」サンプル分布がある場合、これは珍しいことではありません。この状況では、アナリストは各統計テストのすべての仮定と制限を慎重に検討し、仮定違反の数が最も少ない統計テストに最大の重みを付ける必要があります。
正規分布を仮定してください。正常性にはさまざまなテストがありますが、それで終わりではありません。一部のテストは、正規分布から多少の逸脱があっても対称分布ではかなりうまく機能しますが、スキュー分布ではうまく機能しません。
一般的な経験則として、前提が明らかに違反している場合はテストを実行しないことをお勧めします。
編集: 2番目の変数については、変換が順序を維持している限り、変数を正規分布(または少なくとも近い)に変換することが可能です。変換によって両方のコホートの正規分布が得られることを十分に確信する必要があります。2番目の変数を対数正規分布に適合させると、対数関数はそれを正規分布に変換します。しかし、分布がパレート(べき法則)の場合、正規分布への変換はありません。
編集:このコメントで示唆されているように、t検定およびその他の帰無仮説有意性検定(NHST)の代替として、ベイジアン推定を必ず考慮する必要があります。
実数値のデータについては、データのブートストラップに基づいて独自のテスト統計を生成することも検討できます。このアプローチは、非正規母集団分布を扱う場合、または便利な分析ソリューションを持たないパラメーターの信頼区間を開発しようとする場合に、正確な結果を生成する傾向があります。(前者はあなたの場合に当てはまります。コンテキストについては後者についてのみ言及します。)
実際の値のデータについては、次のことを行います。
その分布が得られたら、実際のサンプルの平均の差を計算し、p値を計算します。
@MrMeritologyの2番目の答えです。実際、私はMWUテストが独立した比率のテストよりも強力ではないかどうか疑問に思っていました。なぜなら、私が学び、教えていた教科書は、MWUは順序(または間隔/比率)データにのみ適用できると言っていたからです。
しかし、下にプロットした私のシミュレーション結果は、MWUテストが実際にプロポーションテストよりもわずかに強力であり、タイプIのエラーを適切に制御していることを示しています(グループ1の母集団比率= 0.50)。
グループ2の人口比率は0.50に保たれます。反復回数は各ポイントで10,000です。Yateの修正なしでシミュレーションを繰り返しましたが、結果は同じでした。
library(reshape)
MakeBinaryData <- function(n1, n2, p1){
y <- c(rbinom(n1, 1, p1),
rbinom(n2, 1, 0.5))
g_f <- factor(c(rep("g1", n1), rep("g2", n2)))
d <- data.frame(y, g_f)
return(d)
}
GetPower <- function(n_iter, n1, n2, p1, alpha=0.05, type="proportion", ...){
if(type=="proportion") {
p_v <- replicate(n_iter, prop.test(table(MakeBinaryData(n1, n1, p1)), ...)$p.value)
}
if(type=="MWU") {
p_v <- replicate(n_iter, wilcox.test(y~g_f, data=MakeBinaryData(n1, n1, p1))$p.value)
}
empirical_power <- sum(p_v<alpha)/n_iter
return(empirical_power)
}
p1_v <- seq(0.5, 0.6, 0.01)
set.seed(1)
power_proptest <- sapply(p1_v, function(x) GetPower(10000, 1000, 1000, x))
power_mwu <- sapply(p1_v, function(x) GetPower(10000, 1000, 1000, x, type="MWU"))