データと平均の差のゼロサムプロパティ


8

私は統計学の研究とこのサイトで新しいです、そして私は平均に関して私の本の「ゼロサム特性」に出くわしました。単純明快なようですが、それでもわかりません。それが公式で与える唯一の情報は

で示される 変数各値とで示されるの平均値の差の合計はゼロに等しくなります。YYiYY¯

誰かがコンセプトをよりよく説明できますか?

回答:


8

あなたはすでにより正式な答えを得ました。この答えは、数学の背後にある「直感」を与えるためのものです。

算術平均はデータ(外れ値を含む)に敏感です。以下に示すようなレバーを想像してください。データは、ビーム上にあるオレンジ色のボールです(ある種のプロットのx軸であり、データがその周りのさまざまな位置に散らばっている値であると想像してください)。ロッドを水平位置にするには、ボールのバランスを取るような場所にヒンジを配置する必要があります。小学校の物理学(または子供の頃の遊び場の体験)から、ボールの配置がてこに与える影響の大きさに役割を果たすことがわかります。「外れている」ボールは、統計ではそれらをどのように呼んでいるのか、「中心」の周りに散らかっているボールよりもはるかに大きな影響力を持っています。平均は、レバーのバランスをとる正確な位置にヒンジを配置する値です。

てこ

つまり、平均は値の間の中央にあると言えます。中心は、ポイントと平均の間の距離(つまり、差異)で定義されます。それは中心にあるので、距離が釣り合っている、つまり、お互いがゼロになることが予想されるため、距離の合計はゼロである必要があり、平均にはこのプロパティ(および平均のみ)があります。

関連する算術平均も確認してくださいなぜ機能するのですか?math.stackexchange.comのスレッド。


1
これは、母集団平均(限界内)ではなく、単純なバニラ平均推定量、またはより高度な平均推定量に当てはまります。実際、ほとんどの収縮推定量は、バニラ推定量と比較して(絶対値で)平均が低くなるため、そのレベルは実際にはバランスが取れていません。
Cagdas Ozgenc 2017年

3
@CagdasOzgenc私はこれが算術平均に適用されることを明示的に述べています。
Tim

1
それは批判ではありません。追加の備考。他の回答は、コメントするほど包括的ではありませんでした。
Cagdas Ozgenc 2017年

6

であるN個の変数の観測値Yとせ¯ Yが= 1y1y2yYは、観測値の算術平均を示します。ゼロ和性はとして数学的に記述することができる: 0= N Σ iが=1YI- ¯ Yが証明:の定義により ¯ yの我々が持っているのn ¯ Y =N1y¯:=1Σ=1y

0=Σ=1yy¯
y¯、ひいては: N Σ iが=1YI- ¯ Y= N Σ iは=1、YIを-N ¯ Y =N ¯ Yが -N ¯ Y =0と解釈:なお、YI- ¯y¯=1Σ=1y=Σ=1y
Σ=1yy¯=Σ=1yy¯=y¯y¯=0。
本質的観察との間の「距離」であり、YI及び算術平均 ¯ Y観測天気を情報は、算術平均よりも小さい以上が依然としての符号を通じて保存されているYI- ¯ Y(もちろんの、距離自体は非負でなければならないであろうとだろう|YI- ¯ Y |)。yy¯yy¯yy¯|yy¯|

y¯Yy¯Yy¯

実際、このプロパティが保持する唯一の数であることが証明から簡単にわかります。

このプロパティを使用して、平均の計算が正しいかどうかを確認できます。


4

Verba docentの典型的なトラハント。

セネカ

1、2、3の3つの数値を取ります。

平均値は2です

値と平均の違いは次のとおりです。

1-2 = -1

2-2 = 0

3-2 = 1

これらの違いの合計は

-1 + 0 + 1 = 0

ゼロサムプロパティは、どの数値から始めても、結果(それらの差とその平均の差の合計)は0になると述べています。


3

Σバツバツ¯=0

バツ1バツ2バツバツ
バツ¯=Σバツ
Σバツバツ¯
Σバツバツ¯=バツ1Σバツ+バツ2Σバツ+バツΣバツ++バツΣバツ
バツ1+バツ2+バツ++バツΣバツ
ΣバツΣバツ
=0
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.