次のデータがあるとします。
set.seed(123)
data <- data.frame(x = c(rnorm(50, 1, 1), rnorm(50, 5, 2)),
y = c(rep('A', 50), rep('B', 50)))
次の箱ひげ図(boxplot(data$x ~ data$y)
)が得られます。
ここで、2つのサンプルが同じ位置パラメーター(中央値または平均値、あるいはその両方)を持っているかどうかをテストしたいとします。私の実際のケースでは、データが明らかに正常ではないため、次のようにWilcoxon-Mann-Whitney検定を実行することにしました。
wilcox.test(data$x ~ data$y)
しかし、私は対立仮説として、B data$y
の「第2」の因子は、より高い位置パラメーターを持つ分布に由来するということを望みます。alternative
パラメータを「大きい」と「小さい」に設定しようとしましたが、どうやら対立仮説は私が探しているものではありません。たとえば、alternative = "greater"
「代替仮説:真の位置シフトは0よりも大きい; alternative = "less"
「代替仮説:真の位置シフトは0未満です。」
必要な対立wilcox.test()
仮説(BはAよりも高い位置パラメーターを持つ分布から得られる)を得るために、関数をどのように調整できますか?または、代わりに別のテストを使用する必要がありますか?
rnorm()
ので、それらは正常である必要があります。正常性の仮定の性質について混乱しているのではないでしょうか。このスレッドを読むのに役立つかもしれません:残差は通常分布しているがyはそうでない場合はどうでしょうか。