平均=中央値は、単峰分布が対称であることを意味しますか?


19

単峰性分布の場合、平均=中央値であれば、分布は対称であると言えば十分ですか?

ウィキペディアは、平均と中央値の関係で次のように述べています

「分布が対称の場合、平均は中央値に等しく、分布の歪度はゼロになります。さらに、分布が単峰性の場合、平均=中央値=モードです。これは、コイントスまたはシリーズ1、2、3、4、...ただし、一般的に逆は成り立たないことに注意してください。つまり、歪度ゼロは、平均が中央値に等しいことを意味しません。」

ただし、必要な情報を収集することは(私にとって)それほど単純ではありません。助けてください。

回答:


27

対称ではない小さな反例は次のとおりです。-3、-2、0、0、1、4は、mode = median = mean = 0の単峰性です。

編集:さらに小さい例は、-2、-1、0、0、3です。

サンプルではなくランダム変数を想像したい場合は、0.4である0を除くすべての確率質量関数0.2でサポートを{-2、-1、0、3}としてください。


6
-2、-1、0、0、3は「最小の」離散反例であると考えています。モードを作成するには2つの等しい値が必要です。対称性を復元して中央値に等しくなることを意味します。また、3は2つの異なる整数の合計として書き込むことができる最小の整数であるため、これらの数値は可能な「最小」(0に近い)整数であると思われます。-1、-1、0、0、2を試してもユニモーダルではなくなるため、明確にすることが重要です。当然、このプロパティを使用して新しいデータセットを取得するためにスケーリングおよび変換できます。
シルバーフィッシュ14年

19

これはコメントとして始まりましたが、長すぎました。私はそれをもっと答えにすることにしました。

ABBA

私はいくつかの追加の問題に対処し、ある程度関連しているここで既にいくつかの広範な答えを指摘したいと思います。

  1. あなたが引用したウィキペディアのページ上の声明も厳密には真実ではありません。たとえば、コーシー分布を考えてみましょう。これは、その中央値については確かに対称ですが、平均値はありません。ステートメントには、「平均と歪度が存在する場合」などの修飾子が必要です。最初の文の前半のより弱い文にそれを減らしたとしても、「平均が存在する場合」は依然として必要です。

  2. あなたの質問は、部分的に歪度ゼロで対称性を部分的に圧縮します(3番目のモーメント歪度を意図していると仮定しますが、他の歪度測定についても同様の議論を書くことができます)。歪度が0であることは、対称性を意味しません。引用の後半部分と、Alexisが引用したWikipediaのセクションでは、これについて言及していますが、2番目の引用で与えられた説明には多少の調整が必要な場合があります。

この答えは、3次モーメントの歪度と平均と中央値の関係の方向との関係が弱いことを示しています(3次モーメントの歪度と2次ピアソンの歪度は対応する必要はありません)。

この回答の項目1. は、Silverfishが提供するものと似ていますが異なる個別の反例を示しています。

編集:私は最終的に私が実際に探していたユニモーダルの例を掘り下げました。

ではこの回答私は、次の家族に言及します:

124expバツ1/4[1αバツ1/4]

2つの特定のメンバー(たとえば、を持つリンクされた回答の特定の例の青と緑の密度)α=0α=12

ここに画像の説明を入力してください

(灰色の線は、非対称性を明確にするためにx軸を中心に反転した青色の密度を示しています)

Whuberは、連続性、単峰性、非対称性のある歪度ゼロの別の例を示します。私は彼の図を再現しました:

連続的な例

これは例を示しており、非対称性を明確に示すために同じものを反転していますが、多くの有用な情報が含まれているオリジナルを読む必要があります。

[ ここでの Whuberの答えは、同じ瞬間をもつ別の非対称連続分布ファミリーを提供します。同じ「2つを選択し、1つを反転して50-50混合物を使用する」トリックを行うと、すべての奇数モーメントがゼロの非対称の同じ結果になりますが、ここではユニモーダルの結果は得られません(おそらくいくつかの例があります)。 ]

答えはここに平均値、中央値とモードとの関係について説明します。

この回答では、対称性の仮説検定について説明します。


どうもありがとう。このstats.stackexchange.com/questions/56511 / ...への言及は、実際には上記の質問をする原因でした。
カカ14年

8

いや

さらに、分布が単峰性である場合、平均=中央値=モードです。

「動物の赤ちゃんが鶏である場合、その起源は卵である」と同じように、「起源が卵である場合、動物の赤ちゃんは鶏である」という意味ではありません。

同じウィキペディアの記事から:

一方の尾が長いが、もう一方の尾が太い場合、歪度は単純な規則に従いません。たとえば、値がゼロの場合は、平均分布の両側の裾が均衡していることを示します。これは、対称分布と、非対称である非対称分布の両方の場合です。その他は短いが太っている。


1
単峰性の対称の場合、最小(0)の密度で(例の構築が簡単)mean = meadian = pointになることに注意してください!
kjetil bハルヴォルセン

2

興味深く理解しやすい例は、二項分布に由来します。

×=

            1        2
    +-------------------+
  1 |       0   .32768  |
  2 |       1    .4096  |
  3 |       2    .2048  |
  4 |       3    .0512  |
  5 |       4    .0064  |
  6 |       5   .00032  |
    +-------------------+

このディスプレイのStataコードはmata : (0..5)' , binomialp(5, (0..5), 0.2)'、おそらく、言及する価値のある統計ソフトウェアと同じかそれより単純でした。

論理ではなく心理学の問題として、この例は、病理学的(他の問題のように、特定の瞬間が存在しない分布を割り引くかもしれない)、または目的のために作られた奇妙なまたは些細な例として納得のいく形で却下することはできませんたとえば、@ Silverfishまたは0、0、1、1、1、3で記述された発明データ。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.