最小0と最大94.33のサンプルの平均74.10と標準偏差33.44があります。
私の教授は、平均プラス1つの標準偏差が最大値を超える方法を尋ねます。
私は彼女にこれについて多くの例を示しましたが、彼女は理解していません。私は彼女を示すためにいくつかの参照が必要です。これについては特に統計書のどの章や段落でもかまいません。
最小0と最大94.33のサンプルの平均74.10と標準偏差33.44があります。
私の教授は、平均プラス1つの標準偏差が最大値を超える方法を尋ねます。
私は彼女にこれについて多くの例を示しましたが、彼女は理解していません。私は彼女を示すためにいくつかの参照が必要です。これについては特に統計書のどの章や段落でもかまいません。
回答:
確かに、平均と1つのsdは最大の観測値を超える可能性があります。
サンプル1、5、5、5を検討してください-
平均値4と標準偏差2があるため、平均値+ sdは6で、サンプルの最大値よりも1大きくなります。Rでの計算は次のとおりです。
> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6
これはよくあることです。これは、大きな値がたくさんあり、左にテールがオフになっている場合(つまり、左に強い歪みがあり、ピークが最大値に近い場合)に発生する傾向があります。
-
同じ可能性は、サンプルだけでなく確率分布にも適用されます。母集団の平均と母集団のsdは、可能な最大値を簡単に超えることができます。
ここでの例です密度。最大値は1です。
この場合、ベータ分布のウィキペディアのページを見ると、平均は次のようになっています:
分散は次のとおりです。
(Wikipediaに頼る必要はありませんが、Wikipediaは簡単に派生できるためです。)
したがって、およびβ = 1の場合私たちは、平均してい≈0.9523とSD≈0.0628をので、平均+ SD、≈1.0152より1の可能な最大値よりも、。
つまり、データ値としては観測できないmean + sdの値を持つことは簡単に可能です。
-
モードが最大であった状況では、ピアソンモードの歪度は 平均値+ sdが最大値を超える場合は 1。正または負の任意の値を取ることができるため、簡単に可能であることがわかります。
-
密接に関連する問題は、多くの場合で見られる二項比率の信頼区間一般的に使用される間隔が、正規近似間隔が制限外生成することができる。
これは単なるサンプル平均+二項式のsdの通常の推定値であり、不可能な値を生成します。
この事実-二項式の通常の近似区間が「不可能な値」を生成する可能性があることは、本や論文でしばしば言及されています。ただし、二項データを扱っているわけではありません。それにもかかわらず、問題-その意味+標準偏差の数は可能な値ではありません-は類似しています。
-
あなたの場合、サンプルの異常な「0」値は、平均値を引き下げるよりもsdを大きくしているため、平均値+ sdが高くなっています。
-
(代わりに、質問は- どのような推論によってそれが不可能になるのでしょうか?
論理的にはもちろん、それが起こる場所を例に挙げてそれが可能であることを実証します。あなたはすでにそれをしました。それがそうでなければならないという明確な理由がない場合、あなたは何をしますか?
例が十分でない場合、どのような証拠が受け入れられますか?
どんな本も誤って声明を出すかもしれないので、本の中の声明を単に指すだけでは本当に意味がありません-私はそれらをいつも見ます。代数の証明(たとえば上記のベータ例から構築できます*)または数値の例(既にお伝えしました)のいずれかが可能であるという直接のデモンストレーションに頼らなければなりません。 。
* whuberは、ベータケースの正確な条件をコメントで提供します。
一般に、ベルヌーイ確率変数の場合 、値を取る 確率で そして価値 確率で 、 我々は持っています
そして欲しい
両面を正方形にする
In words, for any Bernoulli random variable with the theoretical expression holds.
So for example, for any i.i.d. sample drawn from a Bernoulli with, say, , in most cases the sample mean plus the sample standard deviation will exceed the value , which will be the maximum value observed (bar the case of an all-zeros sample!).
For other distributions we always have the opposite direction in the inequality, e.g. for a Uniform , it is always the case that .
Therefore, no general rule exists.