P(Mi<Fj)>12i,jMii
もちろん、フレーズの他の解釈も可能です(結局のところ、それが曖昧さです)。これらの他の可能性のいくつかは、ユーザーの推論と一致している可能性があります。
[サンプルと母集団のどちらについて話しているのかという問題もあります...「ほとんどの男性[...]ほとんどの女性」は、人口の声明のようです(潜在的な時代の人口について)。私たちはサンプルとして扱っているように見えるので、主張を広範に行うことに注意する必要があります。]
ことに注意してください。P(Mi<Fj)>12M˜<F˜
[ 男性が女性よりも速いランダムなMFペアの割合が1/2を超えると考えるのは間違っていると言っているのではありません。ほぼ間違いなく正しいです。単に中央値を比較するだけではそれを判断できないと言っているだけです。また、他のサンプルの中央値より上または下の各サンプルの比率を見てもわかりません。別の比較を行う必要があります。]
12
例:
データセットA:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
データセットB:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
データセットC:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(データはここにありますが、そこで別の目的に使用されています-私の思い出に私はこれを自分で生成しました)
Aの比率<Bの比率は2/3、A <Cの比率は5/9、B <Cの比率は2/3であることに注意してください。A対BとB対Cはどちらも5%レベルで有意ですが、サンプルの十分なコピーを追加するだけで任意のレベルの有意性を達成できます。サンプルを複製し、十分に小さなジッター(ポイント間の最小ギャップよりも十分に小さい)を追加することで、タイを回避することもできます。
サンプルの中央値は他の方向に進みます:中央値(A)>中央値(B)>中央値(C)
繰り返しますが、サンプルを繰り返すことにより、中央値を任意の有意水準と比較することで有意性を達成できます。
それを現在の問題に関連付けるために、Aが「女性の時代」であり、Bが「男性の時代」であると想像してください。次に、男性の時間の中央値はより速くなりますが、ランダムに選択された男性は、ランダムに選択された女性よりも時間の2/3遅くなります。
サンプルAおよびCからキューを取得すると、次のように(Rで)より大きなデータセットを生成できます。
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
Fの中央値は約16.25ですが、Mの中央値は約11.25ですが、F <Mの場合の比率は5/9になります。
[n / 3をパラメーター二項変量に置き換えた場合n13
も注意してくださいP(F<med(M))=23P(M>med(F))=23med(M)<med(F)