1つの中央値が別の中央値よりも低いという事実は、なぜグループ1の大部分がグループ2の大部分よりも少ないことを意味しないのですか?


9

以下の箱ひげ図は、(このデータセットでは)「ほとんどの男性がほとんどの女性よりも速い」と解釈できると信じていました。しかし、Rと統計のクイズに関するEdXコースは、それが正しくないと教えてくれました。私の直感が正しくない理由を教えてください。

ここに質問があります:

2002年にニューヨークシティマラソンで出場した無作為のサンプルについて考えてみましょう。このデータセットは、UsingRパッケージにあります。ライブラリをロードしてから、nym.2002データセットをロードします。

library(dplyr)
data(nym.2002, package="UsingR")

ボックスプロットとヒストグラムを使用して、男性と女性の終了時間を比較します。次のうちどれが違いを最もよく説明していますか?

  1. 男性と女性の分布は同じです。
  2. ほとんどの男性はほとんどの女性よりも速いです。
  3. 男性と女性は同様に右に歪んだ分布をしており、前者は20分左にシフトしています。
  4. 両方の分布は通常、平均で約30分の差で分布します。

以下は、分位数、ヒストグラム、箱ひげ図としての男性と女性のニューヨークマラソン時間です。

# Men's time quantile
      0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
      0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

男性と女性の時間-ヒストグラム

男性と女性の時代-ボックスプロット


同じ分布を視覚的に確認するには、ヒストグラムで同じxドメインとビンを使用し、y軸で相対頻度を示す必要があります。ビンバンドのサイズは、より細かい粒度(25分や50分など)の恩恵を受けます。さらに、箱ひげ図とヒストグラムの両方で、中央値(すでに箱ひげ図にある)、平均、およびモードを描画します。
g3o2 2017

{0,3}{2}0.5P(X>Y)>0.5

回答:


7

あなたが間違っているとマークされた理由は、多肢選択式の質問にあなたが与えた答えが間違っていたというよりはむしろ、オプション3「男性と女性は前者と同様の右に歪んだ分布を持ち、20分が左にシフトしている」提供された情報に基づいて情報が提供されるため、より良い選択でした。


私はこの説明に同意します。また、「最も速い」はあいまいです。@glen_bによる回答にもかかわらず、この種の言語のボックスプロットでは、はるかに多くの分離が予想されます。「男性の75%すべてが女性の75%すべてよりも速い」のように、男性の75パーセンタイルは女性の25パーセンタイルよりも低いと解釈できます。しかし、言語があいまいです。
Sal Mangiafico 2017

1
また、これは複数の選択肢のテストを取るという原則になります:常に最良の答えを選択してください。
Sal Mangiafico 2017

意味あり; 他の選択肢が間違っていたというわけではありませんが、正しい選択(「男性と女性は前者と同様に右に歪んだ分布で、20分左にシフトしています。」)の方が正しかったです。ただし、ヒストグラムに20分の変化が見られません。私にとっては50分のシフトのように見えます。私には2つのチャンスがあったので、正解はFWIW :-)でした。
クミン2017

@cumin:それが実際に正しいかどうかはわかりません。「ほとんどの男性はほとんどの女性よりも速い」は「ほとんど」の意味が曖昧です。厳密な定義を見たことがないと思いますが、直感的には、通常50%を大幅に超えています(おそらく70%+?)。 。彼らが「多数派」と言った場合、おそらくそれはより明確になるでしょう。
user541686

9

これが私が見つけることができる最小の反例です:

1,4,10;  B 0、6、9

  • A[1, 4, 10])B[0, 6, 9])は同じ平均(5)を持っています

  • Bの中央値(6)はA4)よりも大きい

  • ランダムA要素がランダムB要素よりも大きい確率は5/9 です。

4つの要素を持つ別の例を次に示します。

1,1,3,10;  B 0、0、6、9


7

P(Mi<Fj)>12i,jMii

もちろん、フレーズの他の解釈も可能です(結局のところ、それが曖昧さです)。これらの他の可能性のいくつかは、ユーザーの推論と一致している可能性があります。

[サンプルと母集団のどちらについて話しているのかという問題もあります...「ほとんどの男性[...]ほとんどの女性」は、人口の声明のようです(潜在的な時代の人口について)。私たちはサンプルとして扱っているように見えるので、主張を広範に行うことに注意する必要があります。]

ことに注意してください。P(Mi<Fj)>12M~<F~

[ 男性が女性よりも速いランダムなMFペアの割合が1/2を超えると考えるのは間違っていると言っているのではありません。ほぼ間違いなく正しいです。単に中央値を比較するだけではそれを判断できないと言っているだけです。また、他のサンプルの中央値より上または下の各サンプルの比率を見てもわかりません。別の比較を行う必要があります。]

12


例:

データセットA:

 1.58  2.10 16.64 17.34 18.74 19.90  1.53  2.78 16.48 17.53 18.57 19.05
 1.64  2.01 16.79 17.10 18.14 19.70  1.25  2.73 16.19 17.76 18.82 19.08
 1.42  2.56 16.73 17.01 18.86 19.98

データセットB:

 3.35  4.62  5.03 20.97 21.25 22.92  3.12  4.83  5.29 20.82 21.64 22.06
 3.39  4.67  5.34 20.52 21.10 22.29  3.38  4.96  5.70 20.45 21.67 22.89
 3.44  4.13  6.00 20.85 21.82 22.05

データセットC:

 6.63  7.92  8.15  9.97 23.34 24.70  6.40  7.54  8.24  9.37 23.33 24.26
 6.18  7.74  8.63  9.62 23.07 24.80  6.54  7.37  8.37  9.09 23.22 24.16
 6.57  7.58  8.81  9.08 23.43 24.45

(データはここにありますが、そこで別の目的に使用されています-私の思い出に私はこれを自分で生成しました)

Aの比率<Bの比率は2/3、A <Cの比率は5/9、B <Cの比率は2/3であることに注意してください。A対BとB対Cはどちらも5%レベルで有意ですが、サンプルの十分なコピーを追加するだけで任意のレベルの有意性を達成できます。サンプルを複製し、十分に小さなジッター(ポイント間の最小ギャップよりも十分に小さい)を追加することで、タイを回避することもできます。

サンプルの中央値は他の方向に進みます:中央値(A)>中央値(B)>中央値(C)

繰り返しますが、サンプルを繰り返すことにより、中央値を任意の有意水準と比較することで有意性を達成できます。

中央値が中央値とは反対方向にP(A <B)を示すようにマークされているサンプルA、B、Cのストリップチャートなど

それを現在の問題に関連付けるために、Aが「女性の時代」であり、Bが「男性の時代」であると想像してください。次に、男性の時間の中央値はより速くなりますが、ランダムに選択された男性は、ランダムに選択された女性よりも時間の2/3遅くなります。

サンプルAおよびCからキューを取得すると、次のように(Rで)より大きなデータセットを生成できます。

n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))

Fの中央値は約16.25ですが、Mの中央値は約11.25ですが、F <Mの場合の比率は5/9になります。

[n / 3をパラメーター二項変量に置き換えた場合n13

も注意してくださいP(F<med(M))=23P(M>med(F))=23med(M)<med(F)


手段がどのように反対方向に進むかはわかりますが、ここでの直感はOPと一致することを認めます。中央値がどうなるかわかりません(サンプリングエラーの問題は別として)。
gung-モニカの回復

@gung例を含めました。私はこのように私の最初の直感を刺すのが好きです-それらの反例を見つけることによって。もっと出くわした場合(どこかに別の場所があると思います)、それらについて言及します。
Glen_b-2017

元の質問の箱ひげ図は、男性の約60〜65%が女性の時間の中央値より短い(つまり、女性の50%の時間より短い)ことを示しています。それは私が説明したいと思っている作品です。
クミン2017

P(Ai<Cj)ij

3
「ほとんどの男性はほとんどの女性よりも速い」というフレーズは「男性の少なくとも50%が女性の少なくとも50%より速い」と解釈します。つまり、男性Xがいる場合、Xが女性の50%より速いかどうかを尋ねるのは理にかなっています。私にとって、主張はそれから男性の少なくとも50%がこの特性を持っていると言います。男性の50%が男性の中央値よりも速く、男性の中央値が女性の中央値よりも速く、女性の50%よりも速いので、男性の中央値が女性の中央値よりも速い場合、これは正しいと思います。(ただし、これは女性と男性のペアの25%しかカバーしていないことに注意してください。これはあなたの素晴らしい例を説明していると思います。)
mathmandan

3

次の図は、このブログ投稿から取られたもので、これらのアイデアの重要な実用的なアプリケーションを示しています。

標準化は、2つの分布を比較するための強力なデバイスを提供します。次の3つの図は、イングランドのNational Child Measurement Program(NCMP)の130か月の男の子と女の子の身長を比較しています。(これは、このデータセットのモーダルエイジでした。1つの年齢コホート内で最も多くのデータを取得するために、したがって最もスムーズなプロットを得るために、これを選択しました。)

図1:イギリスのNational Child Measurement Program(NCMP)による、130か月の男の子と女の子の身長

図1:イギリスのNational Child Measurement Program(NCMP)による、130か月の男の子と女の子の身長

図2:130ヶ月の男の子と女の子の身長のパーセンタイル。 出典:英語NCMP

図2: 130ヶ月の男の子と女の子の身長のパーセンタイル。出典:英語NCMP

図3:同年齢の男の子と比較した130ヶ月の女の子の身長の分布。

図3:同年齢の男の子と比較した130ヶ月の女の子の身長の分布。

これらの最後の図では、身長の比較は男の子の身長に応じて標準化されています。したがって、図3の灰色の点線に沿って読むと、次のようなステートメントを作成できます。

  • 男の子の中央値(つまり、50パーセンタイル)の高さは、女の子の約45パーセンタイルです。したがって、100%– 45%= 55%の女の子は中央値の男の子よりも背が高かった。
  • 女の子の上位四分位の高さ(75パーセンタイル)は、男の子の上位五分位(80パーセンタイル)に当たります。したがって、130カ月齢の子供のうち、4人の少女のうち3人よりも高い少女は、5人の少年のうち4人よりも高い。

このプロットで考えられる混乱の1点に言及する価値があります。男の子の45度線は女の子のマゼンタ曲線よりもプロット上で「高い」が、この観察はこの年齢(これらは6年生)で、女の子は通常男の子より背が高いというよく知られた事実に対応している。この高さは、マゼンタの曲線が青い線に対して右にシフトしているという事実に適切に反映されていることに注意してください。

(0,0)(1,1)

元の質問は、図3のマゼンタ曲線を描画して(a)中央値間の仮定関係と(b)@Glen_b彼の答えは(正しく、私は信じています)解明されました。分布の不連続性(密度の点質量)によって、「病理学的」なケースを提供できるようになるのではないかと思います。私は、そのような病理学的な事件が「ルールを証明する例外」になると推測します。


xxこのプロパティがあります。このため、クイズの質問に対する答えはyesになります

一方、「most」の実際の意図が "> 50%"だった場合、より正確なフレーズ「過半数」が採用されたと予想できます。誰かが「おそらく」何かが起こると私に言った場合、私は60%以上の主観的確率が示唆されていると思います。同様に、私にとって「最も」とは、70〜80%のようなものを意味します。明らかに、上のプロットから、「most」が52.5%よりも厳しい基準として採用されている場合、「ほとんどの女の子は、ほとんどの男の子よりも背が高い」とは言えません。クイズの質問の理論的根拠の一部は、単語が数値の概念に関連しているため、単語の試験を刺激することだったのでしょうか。(これが少しばかげていると思う場合は、これらのグラフを検討してください、人々が異なる確率的な単語やフレーズをどのように解釈する傾向があるかを示しています。)おそらく、その目的は、実際の分布に多くの変動が存在し、単一の統計(中央値、平均、何を持っているか)を強調することでもありました。あなた)が広範囲にわたる広範なステートメントをサポートすることはめったにありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.