中央値が外側にある反例[モード平均]


11

この記事は私のリーグを超えていますが、私が興味を持っているトピック、平均値、最頻値、中央値の関係について述べています。それは言う:

単峰分布の中央値は「通常」、平均と最頻値の間であると広く信じられています。ただし、これは常に正しいとは限りません...

私の質問:中央値が[モード、平均]間隔の外にある連続単峰(理想的には単純)分布の例を誰かが提供できますか?たとえば、のようなディストリビューションmode < mean < median

===編集=======

Glen_bとFrancisによる良い回答は既にありますが、私が本当に興味を持っているのは、モード<平均<中央値または中央値<平均<モード(つまり、両方の中央値が[mode、mean]の外側であり、中央値がモードの意味としての「同じ側」(つまり、モードの上下両方))。ここで答えを受け入れることができます。新しい質問が開かれますか、または誰かがここで解決策を直接提案できますか?


より制限されたケースをカバーするために回答を拡張することは問題ありません。
Glen_b-2016

2
ここで図6を確認してください。ww2.amstat.org / publications / jse / v13n2 / vonhippel.htmlは、中央値がモードと平均の間にない(連続的な単峰型の)ワイブルの例を示しています。
マシュータワーズ

回答:


14

確かに、中央値が平均と最頻値の間にない例-連続単峰型の例でさえ-見つけるのは難しくありません。

  1. 考えます。T1,T2fT(t)=2(1t)10<t<1

    XT14T2

    X

    2つの三角形の密度と、モード平均間隔外の中央値との混合

    平均は0未満で、モードは0ですが、中央値は0を上回ります。これを少し変更すると、(cdfだけでなく)密度さえ連続である例が得られますが、位置と測定値の関係は同じ(編集:以下の3.を参照)。

  2. p0<p<1(1p)β4β>0

    2つの三角形密度の混合の一般化バージョンの密度

    ここで仮定しますp>120p>1211/2p

    (pβ(1p))/3

    β>p/(1p)β<p/(1p)

    (pβ(1p))/3<11/2p

    p=0.7

    β=2β<p/(1p)

    11/1.40.15480.72(0.3)30.0333p=0.7β=2

    xt

  3. これは密度自体が連続している例です。これは、上記の1.と2.のアプローチに基づいていますが、「ジャンプ」が急な勾配に置き換えられています(そして、右スキューに見える例が必要なため、密度全体が0で反転しました)。

    中央値<平均値<モードの連続的な区分的線形密度

    T13T25T3

    上の図でわかるように、要求通り、平均は真ん中です。


  1. [mode,mean]k

    特に、ワ​​イブル形状パラメータの値が小さい場合、分布は右スキューであり、モードと平均の間の中央値の通常の状況になりますが、ワイブル形状パラメータの値が大きい場合、分布は左スキューです。 、そして再び「中間の中央値」の状況になります(ただし、現在では平均ではなく右側にモードがあります)。それらのケースの間には、中央値が平均モード間隔の外側にある小さな領域があり、その中央で平均とモードが交差しています。

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    上記の(1)と(2)でマークされた間隔(位置統計間のギャップがほぼ等しい値)の形状パラメーターの便利な値を選択すると、次のようになります。

    モード平均間隔外の中央値を持つワイブル密度

    これらは要件を満たしていますが、残念ながら3つの位置パラメーターは非常に接近しているため、視覚的に区別できません(すべて同じピクセルに分類されます)。これは少しがっかりです。以前の例のケースははるかに分離した。(それにもかかわらず、他の分布で調べる状況を提案します。そのいくつかは、より視覚的に明確な結果をもたらす可能性があります。)


うまくいきました。好奇心から、モード<中央値<中央値の場合、同様の「三角分布」とは何でしょうか?(ここでは中央値<モード<平均)
Janthelme

4T21.25T20.60.4

6

次の例は、確率におけるヨルダン・ストヤノフの反例からの抜粋です。

cλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMX
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)
c22+cλ=1.
c1λ2c>111.0001μ>cM=cmμM

0

0 <= x <無限大に対して、速度パラメーターaと密度a exp(-ax)を持つ指数分布をとります。モードはゼロです。もちろん、平均値と中央値は0より大きい値です。累積分布関数は1-exp(-ax)です。したがって、xのexp(-ax)= 0.5の中央値の解決について。次に、-ax = ln(0.5)またはx = -ln(0.5)/ aです。平均の場合、0から無限大までのax exp(-ax)を積分します。a = 1をとると、中央値= -ln(0.5)= ln(2)および平均= 1になります。

つまり、モード<中央値<平均です。


1
申し訳ありませんが、モード<平均<中央値(またはより一般的には中央値が[モード、平均]の外にある場合)の分布を探していませんか?
Janthelme、2016

3
混乱して申し訳ありませんが、元の質問に追加しましたが、最初に質問していたのは、中央値が[mode、mean]の外側にあるのに対して、中央値は[mode、median]の内側にあると思う例です。
Janthelme、2016

3
マイケル、質問は中央値が最頻値と平均値の中間にある場合を求めていません。このコメントのすぐ上のコメントでオリジナルを誤って引用しています。質問は、「mode <median <mean "とは言っていません(編集履歴のどの時点でもそうしたことはありません)。結果として、あなたの答えは要求されないケースを提供します。実際、それは、質問が例外を求める通常の状況(他の2つの中央値)です。ほとんどすべての有名な歪んだ単峰型分布の中央値が中央にあります-トリックは、それを行わない分布を見つけることです。
Glen_b-2016

1
編集履歴は、質問の下部にある「18時間前に編集されました」という赤いリンクをクリックすると表示されます(これらのコメントを入力しているときに19に変更されました)。そこをクリックすると、編集の履歴を表示できます。質問は22時間前に投稿され(今、これを入力しています)、編集履歴をクリックすると、元の質問が「1」というラベルの付いた下部に表示されます。あなたの答えは、約2時間後(20時間前)に現れました。投稿後約1〜2時間で、OPは質問を1回編集しました。これは表示されます...
Glen_b -Reinstate Monica

1
ctd ...編集履歴の上部にあります。各編集の後に、その編集の一部としてカウントされる変更を行うための2分のウィンドウがあります(つまり、22時間前と18〜19時間前には、誤字が修正された可能性のある毎分分のウィンドウ)しかし、投稿してから20時間前までは、質問は約2時間変更されておらず、投稿後1時間以上変更されていません。編集履歴に表示)が実行されました。これらの2分間の事後編集ウィンドウ以外での編集は、編集履歴に含まれます。
Glen_b-2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.