差は要約統計量:ジニ係数と標準偏差


12

いくつかの要約統計があります。分布の広がりを記述したい場合は、たとえば標準偏差ジニ係数を使用できます。

標準偏差は中心傾向、つまり平均からの偏差に基づいており、ジニ係数は分散の一般的な測定値であることを知っています。また、ジニ係数には下限と上限[0 1]があり、標準偏差にはないことも知っています。これらの特性は知っておくと良いですが、ジニでは不可能で逆に標準偏差でどのような洞察が得られますか?2つのうちの1つを使用することを選択する必要がある場合、有益で洞察力を持つことに関して、他のものと比較して1つを使用する利点は何ですか。


1
奇妙なタグの選択がありました。編集しました。
amoeba氏は、2016

回答:


8

考慮すべき2つのこと

ジニはスケールに依存しませんが、SDは元の単位です

上と下に境界のあるメジャーがあるとします。SDは、半分の測定値が各境界にある場合に最大値をとりますが、Giniが最大値をとるのは、一方が一方の境界にあり、残りがすべて他方にある場合です。


メタ分析の濃度/不均一性を説明するためにGiniの使用を拡大できると思いますか?不均一性の濃度を定量化する手段として興味深いかもしれません...
Joe_74

1
影響は正常であるという仮定なので、違います。しかし、私はこのスレッドではより完全な議論はトピック外だと思います
mdewey

@mdeweyその最後の文は洞察に富み、私を最も助けてくれました。THX!
Olivier_s_j 2016年

@mdewey自分でこれをいくつかのコードでテストしましたが、これについて議論している出版物はどこにありますか?または証拠?(私は最後の文を参照しています)
Olivier_s_j '19年

@Ojtwistウィキペディアの記事en.wikipedia.org/wiki/Gini_coefficientが役立ちます。
mdewey 2016年

10

ジニ係数はスケールに対して不変で制限があり、シフトに対して標準偏差は不変で、制限がないため、直接比較することは困難です。これで、平均(変動係数)で除算することにより、標準偏差のスケール不変バージョンを定義できます。

ただし、ジニインデックスは依然として値に基づいており、2番目の値は2乗された値であるため、2番目の値は外れ値(過度に低いまたは高い値)の影響をより大きく受けると予想できます。これは、所得格差の測定、F De Maio、2007年に記載されています。

この所得格差の測定は、所得分布の標準偏差をその平均で割ることによって計算されます。より均等な所得分布は、標準偏差が小さくなります。そのため、CVはより平等な社会ではより小さくなります。不平等の最も単純な尺度の1つであるにもかかわらず、CVの使用は公衆衛生の文献ではかなり制限されており、所得格差仮説の研究では取り上げられていません。これは、CVメジャーの重要な制限が原因である可能性があります。(1)Gini係数とは異なり、上限がないため18、解釈と比較が多少難しくなります。(2)CVの2つの構成要素(平均と標準偏差)は、異常に低いまたは高い収入値によって非常に影響を受ける可能性があります。言い換えると、

1(xm)=|xnm|1/2N2(x)1(x)N2(x)

1/2

1/2

したがって、ほぼガウス分布を特徴付ける必要がない限り、スパース性を測定する場合は、Giniインデックスを使用します。異なるモデル間でスパース性を促進する場合は、そのようなノルム比を試すことができます。

追加の講義:ジニの平均差:非正規分布の変動性の優れた尺度、Shlomo Yitzhaki、2003年。

変動性のすべての測定値の中で、分散性は群を抜いて最も人気があります。この論文では、変動性の代替指標であるジニの平均差(GMD)は、分散と多くの特性を共有していますが、正規性から逸脱する分布の特性については、より有益である可能性があると主張しています。


1

標準偏差にはスケールがあります(たとえば、°K、メートル、mmHgなど)。通常、これはその大きさの判断に影響します。そのため、変動係数または標準誤差よりも(有限サンプルでは)より良い傾向があります。

[0,1]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.