平均、中央値、モード間の経験的関係


40

適度に歪んだユニモーダル分布の場合、平均、中央値、モードの間に次の経験的関係があります。 この関係はどうでしたか派生?

(Mean - Mode)3(Mean - Median)

この結論を形成する前に、カールピアソンはこれらの関係を何千もプロットしましたか、それともこの関係の背後に論理的な推論の線がありますか?

回答:


29

は平均( average)、は中央値、は標準偏差、はモードを表します。最後に、サンプルとし、最初の2つのモーメントが存在する連続的な単峰性分布を実現します。μmσMXF

それはよく知られています

(1)|μm|σ

これは頻繁に行われる教科書の練習です。

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
最初等式は平均の定義から派生します。3番目は、中央値が(すべてのの中で)一意のミニマイザーであるためですそして、ジェンセンの不等式からの4番目(すなわち、凸関数の定義)。実際、この不平等はより厳しくすることができます。実際、上記の条件を満たす任意のについて、次のことを示すことができます[3]cE|Xc|F

(2)|mμ|0.6σ

一般に、ユニモーダル分布がいずれかを満たす必要があることは事実ではありませんが(Abadir、2005) 、不平等

Mmμ or Mmμ

(3)|μM|3σ

(スキューに関係なく)ユニモーダルの正方積分可能分布を保持します。これは、Johnson and Rogers(1951)で正式に証明されていますが、この証明は、ここに収めるのが難しい多くの補助補題に依存しています。オリジナルの論文をご覧ください。


分布がを満たすための十分条件は、[2]で与えられます。場合:FμmMF

(4)F(mx)+F(m+x)1 for all x

その後、。さらに、場合、不等式は厳密です。ピアソンタイプIからXIIへの分布は、 [4] を満たす分布のファミリーの一例です(たとえば、ワイブルはが成り立たない一般的な分布の1つです。[5]を参照)。μmMμm(4)(4)

が厳密に成り、というwlogであると仮定すると、 (4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

また、これら2つの範囲の2番目は空ではないため、アサーションが真である分布を見つけることは確かに可能です(たとえば、)分布のパラメーターの値のある範囲についてですが、すべての分布についてはそうではなく、を満たすすべての分布についてもそうではありません。0<mμ<33<σ=1(4)

  • [0]:ユニモーダル分布のモーメント問題。NLジョンソンとCAロジャース。数理統計学年報、Vol。22、No。3(1951年9月)、pp.433-439
  • [1]:平均メディアンモードの不等式:反例Karim M. Abadir Econometric Theory、Vol。21、No。2(2005年4月)、pp。477-482
  • [2]:WR van Zwet、平均、中央値、モードII、統計。Neerlandica、33(1979)、pp.1-5
  • [3]:ユニモーダル分布の平均、中央値、およびモード:特性評価。S.バスおよびA.ダスグプタ(1997)。理論プロバブ。Appl。、41(2)、210–223。
  • [4]:平均、中央値、モード、歪度に関するいくつかの注意。佐藤道一。オーストラリア統計局。39巻、第2号、219〜224ページ、1997年6月
  • [5]:PT von Hippel(2005)。平均、中央値、およびスキュー:教科書の規則の修正。Journal of Statistics Education Volume 13、Number 2。

すみません、私はちょうど1年生の数学の学生です。関係がどのように派生したかを説明するリンク/ブック/ペーパーを提供/推奨していただけますか?
サラ

3
@Sara私はそれが彼の「ピアソンモード歪度」のためにこの経験的な関係を使用するカールピアソンにさかのぼると思います。これとは別に、このオンライン記事j.mp/aWymCvに興味があるかもしれません。
chl

あなたが提供したリンクと回答について、chlとkwakに感謝します。勉強します。
サラ

2
さまざまなポイント:がの中央値である場合、最小化されます。Von Hippelの記事(上記でchlにリンク)は例外を論じており、btinternet.com / 〜se16 / hgb / median.htmは、連続分布と離散分布の両方について、平均、中央値、モード、標準偏差の関係を示しています。3は実際には任意の値を取ることができます:正、負、ゼロまたは無限。E|Xk|kX
ヘンリー

1
私は少し密度が高いのかもしれません(初めてではないでしょう)。あなたはどのように明確にすることができます(1)と(3)から続きますか?|Mμ|3|μm|
Glen_b

9

紙のchlはいくつかの重要な情報を示しています-それが一般的な規則に近いものではないことを示しています(ワイブルのような、連続的で滑らかな「うまく動作する」変数であっても)。したがって、それはしばしばほぼ真実かもしれませんが、しばしばそうではありません。

それで、ピアソンはどこから来たのでしょうか?彼はどのようにしてこの近似値に到達しましたか?

幸いなことに、ピアソンは自分で答えをほとんど教えてくれます。

私たちが使用している意味での「スキュー」という用語の最初の使用は、ピアソン、1895 [1](タイトルのすぐ近くに表示されます)のようです。この論文は、彼がモードという用語を紹介する場所でもあるようです(脚注、p345)。

最大周波数の縦座標に対応する横座標にモードという用語を使用すると便利です。「平均」、「モード」、および「中央値」には、統計学者にとって重要なすべての特徴があります。

それはまた、彼の周波数曲線システムの最初の本当の詳細であるように見えます。

したがって、ピアソンタイプIII分布の形状パラメーターの推定(現在ではシフトガンマと呼ばれることもある)を議論する際に、彼は言います(p375)。

平均、中央値、モードまたは最大縦座標は、それぞれbbcc、およびaaでマークされ、曲線が描かれるとすぐに、3つの量の位置間に顕著な関係が現れました:中央値が正である限り*は、平均値から最大値への約3分の1であることが確認されました。p

*これは、形状パラメーターがより大きいガンマに対応します>1

ここで「最大」の意図は、ランダム変数の最大値ではなく、引用符の先頭から明らかなように、最大​​周波数(モード)の値です。x

実際、ガンマ分布の(平均モード)と(平均中央値)の比率を見ると、次のことがわかります。

ここに画像の説明を入力してください

(青い部分は、ピアソンが近似が妥当であると言っている領域を示しています)。

実際、ピアソンシステムの他のいくつかの分布(たとえばベータ分布など)を見ると、とが小さすぎない限り、同じ比率がほぼ成り立ちます。αβ

ここに画像の説明を入力してください

(のベータのサブファミリーの特定の選択は、モーメント歪度にが現れるために行われました。定数を増やすことは、モーメント歪度の減少に対応するような方法で。興味深いことに、および値では、、曲線はほぼ一定の(平均モード)/(平均中央値)をもち、は十分に大きいですが、小さい方に最小値がある可能性がありますβα=kβααβααββ+α=cβ+ααおよび。)β

逆ガンマもピアソンシステムにあります。それも、形状パラメータの大きな値(たとえば、おおよそ)に関係があります:α>10

ここに画像の説明を入力してください

ピアソンは対数正規分布にも精通していることが期待されるはずです。その場合、モード、中央値、平均はそれぞれ、です。それは彼のシステムの開発に先立って議論されたもので、しばしばGaltonに関連しています。eμσ2,eμeμ+σ2/2

(平均モード)/(平均中央値)をもう一度見てみましょう。分子と分母の両方から係数をキャンセルすると、。一次(が小さい場合に正確になります)には、分子はで、分母はになります。少なくとも小さな場合、対数正規分布にも当てはまります。eμeσ2/2eσ2eσ2/21σ232σ212σ2σ2

かなりの数のよく知られた分布があります-そのうちのいくつかはピアソンがよく知っていました-そのため、広範囲のパラメータ値に対してほぼ真です。彼はガンマ分布でそれに気づきましたが、彼が考慮しそうな他のいくつかの分布を見るようになったときに、アイデアが確認されていたでしょう。

[1]:Pearson、K.(1895)、
「進化の数学理論への貢献、II:均質物質のスキュー変動」
、王立協会の哲学的トランザクション、シリーズA、186、343-414
[著作権切れ。こちらから無料で利用できます ]


4

この関係は派生していません。ほぼ対称的な分布を経験的に近似的に保持することが注目されました。統計理論の紹介(1922)、p.121、第VII章20節のYuleの説明を参照してください。彼は経験的な例を示しています。


+1確かに、ピアソン1895の私の引用は、それが彼が導き出したものではなく、彼が気づいたものであることを示しています。
-Glen_b

2
古い数学のテキストは、今日の執筆よりも読むのがとても楽しいです
-Aksakal
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.