プラス1標準偏差が最大値を超えることを意味できますか?


19

最小0と最大94.33のサンプルの平均74.10と標準偏差33.44があります。

私の教授は、平均プラス1つの標準偏差が最大値を超える方法を尋ねます。

私は彼女にこれについて多くの例を示しましたが、彼女は理解していません。私は彼女を示すためにいくつかの参照が必要です。これについては特に統計書のどの章や段落でもかまいません。


なぜ平均から1つの標準偏差を加算(または減算)したいのですか?SDは、データの広がりの尺度です。代わりにおそらく平均の標準誤差が必要ですか?
モニカの復活-G.シンプソン14年

足したり引いたりしたくありません。これが欲しいのは私の教授です。それは彼女がスタンダール偏差を理解する方法です
Boyun Omuru

5
興味深い例はサンプル(0.01,0.02,0.98,0.99)です。平均プラス標準偏差と平均マイナス標準偏差の両方が[0,1]の外側にあります。
-Glen_b-モニカーを復活14

たぶん彼女は正規分布を考えているのでしょうか?
user765195 14年

回答:


28

確かに、平均と1つのsdは最大の観測値を超える可能性があります。

サンプル1、5、5、5を検討してください-

平均値4と標準偏差2があるため、平均値+ sdは6で、サンプルの最大値よりも1大きくなります。Rでの計算は次のとおりです。

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

これはよくあることです。これは、大きな値がたくさんあり、左にテールがオフになっている場合(つまり、左に強い歪みがあり、ピークが最大値に近い場合)に発生する傾向があります。

-

同じ可能性は、サンプルだけでなく確率分布にも適用されます。母集団の平均と母集団のsdは、可能な最大値を簡単に超えることができます。

ここでの例です密度。最大値は1です。beta(10,12)

ここに画像の説明を入力してください

この場合、ベータ分布のウィキペディアのページを見ると、平均は次のようになっています:

E[X]=αα+β

分散は次のとおりです。

var[X]=αβ(α+β)2(α+β+1)

(Wikipediaに頼る必要はありませんが、Wikipediaは簡単に派生できるためです。)

したがって、およびβ = 1の場合α=10私たちは、平均してい0.9523とSD0.0628をので、平均+ SD、1.0152より1の可能な最大値よりも、。β=120.95230.06281.0152

つまり、データ値としては観測できないmean + sdの値を持つことは簡単に可能です

-

モードが最大であった状況では、ピアソンモードの歪度平均値+ sdが最大値を超える場合は 1。正または負の任意の値を取ることができるため、簡単に可能であることがわかります。<1

-

密接に関連する問題は、多くの場合で見られる二項比率の信頼区間一般的に使用される間隔が、正規近似間隔が制限外生成することができる[0,1]

10

p^+2×14p^(1p^)=p^+p^(1p^)=0.75+0.433=1.183

これは単なるサンプル平均+二項式のsdの通常の推定値であり、不可能な値を生成します。

p^(1p^)nn1

この事実-二項式の通常の近似区間が「不可能な値」を生成する可能性があることは、本や論文でしばしば言及されています。ただし、二項データを扱っているわけではありません。それにもかかわらず、問題-その意味+標準偏差の数は可能な値ではありません-は類似しています。

-

あなたの場合、サンプルの異常な「0」値は、平均値を引き下げるよりもsdを大きくしているため、平均値+ sdが高くなっています。

enter image description here

-

(代わりに、質問は- どのような推論によってそれが不可能になるのでしょうか?

論理的にはもちろん、それが起こる場所を例に挙げてそれが可能であることを実証します。あなたはすでにそれをしました。それがそうでなければならないという明確な理由がない場合、あなたは何をしますか?

例が十分でない場合、どのような証拠が受け入れられますか?

どんな本も誤って声明を出すかもしれないので、本の中の声明を単に指すだけでは本当に意味がありません-私はそれらをいつも見ます。代数の証明(たとえば上記のベータ例から構築できます*)または数値の例(既にお伝えしました)のいずれかが可能であるという直接のデモンストレーションに頼らなければなりません。 。

* whuberは、ベータケースの正確な条件をコメントで提供します。


5
0<β<1α>β(1+β)/(1β)(α,β)1

さらに説明させてください。歯の矯正に使用される特定の器具の精度の割合を探しています。また、このアプライアンスは、7つの歯について、%76,19、%77,41、%94,33、%91,06、%0、%87,77、%91,96の精度パーセンテージを実行しました。私の教授は、平均値に標準偏差を1つ追加し、%100はappliancekが実行できる最大精度の割合であるため、結果が%100でも最大値を超えることはできないと述べています。
-Boyun Omuru 14

2
彼女は、100%を超える割合はあなたの状況では意味がないと言っています。問題は、実際には、1つのsdを平均値に追加するのが理にかなっている場合に、このコンテキストで意味があるという前提のないことです。それが私があなたの難しさの起源だと信じているところです。前提がどこから来たのかを理解すれば、より良い解像度につながる可能性があります。簡単な事実がどこかの本で述べられている可能性はありますが(それは些細な観察ですが、そうではない可能性もあります)、私はそれが彼女を満足させる方法で置かれることを疑います前提が問題の原因です。
グレン_b-モニカの復活14

1
確かに、私のマイナーな点は、この好奇心は、サンプルを取る結果ではなく、標準偏差が強く非対称な分布を表す結果であるということです。しかし、一般的に、あなたの答えは素晴らしいと思う
ヘンリー14年

2
@tomka私は同じような立場の多くの学生を助けようとしました。最終的に、学生の媒体を通してスーパーバイザーに何かを教えることは事実上不可能であるという(おそらく驚くべきことではない)経験則を学びました。
Glen_b-モニカを

4

チェビシェフの不等式ごと、k未満 -2ポイントはk標準偏差を超えることがあります。したがって、k = 1の場合、サンプルの100%未満が1標準偏差以上離れている可能性があることを意味します。

下限を見るともっと面白いです。あなたの教授は、平均より約2.5標準偏差のポイントがあることにもっと驚くべきです。しかし、サンプルの約1/6のみが0になることがわかっています。


3

σσ


5
これは素晴らしい貢献です。ただし、SDが正規分布を本当に「想定」しているのかどうかはわかりません。
GUNG -復活モニカ

3
「分布フィッティング」と正規化への変換を見つけることは、目的が異なる別個の手順です。
whuber

2

一般に、ベルヌーイ確率変数の場合 バツ、値を取る 1 確率で 0<p<1 そして価値 0 確率で 1p、 我々は持っています

Eバツ=pSEバツ=p1p

そして欲しい

Eバツ+SEバツ>1p+p1p>1

p1p>1p

両面を正方形にする

p(1p)>(1p)2p>1pp>12

In words, for any Bernoulli random variable with p>1/2 the theoretical expression E(X)+SE(X)>maxX holds.

So for example, for any i.i.d. sample drawn from a Bernoulli with, say, p=0.7, in most cases the sample mean plus the sample standard deviation will exceed the value 1, which will be the maximum value observed (bar the case of an all-zeros sample!).

For other distributions we always have the opposite direction in the inequality, e.g. for a Uniform U(a,b), it is always the case that E(U)+SE(U)<maxU=b.
Therefore, no general rule exists.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.