サンプルの標準偏差が0.0と報告されている場合、20人の被験者全員が同じ身長ですか?


8

私がレビューしている研究では、20人の被験者の平均身長が1.70メートルで標準偏差が0.0であると報告されています。これは、20がすべて1.70メートルであることを意味しますか?または、これは報告エラーですか?

回答:


16

この生物学のSEスレッドによると、男性の成人の身長の標準偏差は約メートル、女性の標準偏差は約0.06メートルです。0.070.06

これらを小数点第1位で四捨五入すると、メートルになります。標準偏差がメートルとして報告されるという事実は、メートル未満の標準偏差を示します...しかし、たとえばメートルの標準偏差は、に丸めるため、報告された数値と一致しますが、サンプルの高さの変動は、一般集団で毎日観察される変動よりもわずかに小さいだけです。0.10.05 0.048 0.00.00.050.0480.0

図はよく報告されていますか?さて、平均がそうであったように、標準偏差が小数点以下2桁で報告されていた場合、それははるかに有用でしょう。また、単純な数値エラーまたは丸めエラーの場合もあります。例えば、されている可能性が切り捨てによりもむしろ丸いです。しかし、図が標準エラーを参照している可能性はありますか?標準偏差と標準誤差のどちらが引用されているかが不明確になるように書かれた数字をよく目にします。たとえば、「サンプル平均は」のようになります。0.0 1.62 ± 0.06 0.070.01.62(±0.06)


正しい標準偏差がから小数点第1位に四捨五入するのはどれほど妥当でしょうか。次のRコードは、標準偏差母集団から抽出されたサイズ20の100万サンプルをシミュレートし(女性の身長について他で報告されているように)、各サンプルの標準偏差を見つけ、結果のヒストグラムをプロットし、観測された標準偏差が未満のサンプル:0.06 0.050.00.060.05

set.seed(123) #so uses same random numbers each time code is run
x <- replicate(1e6, sd(rnorm(20, sd=0.06)))
hist(x)
sum(x < 0.05)/1e6

[1] 0.170691

標本標準偏差のヒストグラム

したがって、丸める標準偏差は妥当ではありません。高さが正規の標準偏差正規分布している場合、約17%の確率で発生します。0.060.00.06

これらの仮定に従って、シミュレーションではなく、次のように約17%の確率を計算することもできます。

P(S2<0.052)=P(19S20.062<19×0.0520.062)=P(19S20.062<13.194)=0.1715

ここで、が度のカイ2乗分布に従うという事実を使用しました自由の。Rの確率はを使用して計算できます。男性の標準偏差の公開された数値に合わせてをに置き換えると、確率は約4%に減少します。@whuberが以下のコメントで指摘しているように、この種の小さな「ゼロへの丸め」SDは、サンプリングされたグループが一般的な母集団よりも均一である場合に発生する可能性が高くなります。人口標準偏差が約 N - 1 = 19 0.06 0.07 0.06(n1)S2/σ2=19S2/0.062n1=19pchisq(q = 19*0.05^2/0.06^2, df = 19)0.060.070.06 メートルの場合、サンプルのサイズが大きければ、このような小さなサンプル標準偏差が得られる確率も低下します。

curve(pchisq(q = 19*0.05^2/x^2, df = 19), from=0.005, to=0.1,
      xlab="Population SD", ylab="Probability sample SD < 0.05 if n = 20")

母集団SDが増加すると、サンプルSDが低い確率は低下します。

curve(pchisq(q = (x-1)*0.05^2/0.06^2, df = x-1), from=2, to=50, ylim=c(0,0.6),
      xlab="Sample size", ylab="Probability sample SD < 0.05 if population SD = 0.06")

サンプルサイズが大きくなると、サンプルSDが低い確率が低下します。


5
+1。研究が、たとえばスポーツチーム、チアリーディンググループなど、同質の人口の人々のグループに関するものであったことももっともらしく、その場合、SDは0.01m以下でした。
whuber

@whuberナイスポイント!SDが0.00(つまり、0.005未満)に丸められることはどれほどもっともらしいかと思い、実際にこれがどれほど厳しい条件であるかに驚いていました。それは実際には比率のキャンセルに帰着するので、おそらくそうすべきではなかったでしょう。ただし、たとえば、チアリーダーの母集団のSDが0.01の場合pchisq(q = 19*0.005^2/0.01^2, df = 19)、サンプルのSDの確率は0.04%しかなく、0.005未満です。SD = 0.008の母集団でも、確率は約0.8%です。しかし、人口SDが0.007、0.006、0.005の場合、確率はそれぞれ4%、17%(偶然ではありません)、54%になります
Silverfish

3
わずかな変化を得るいくつかの方法を想像できます。最小または最大の高さを課す条件を想像してみてください。たとえば、過去に、多くの軍隊が、たとえば、彼らの戦車の乗組員に最大の高さを課したか、または一部の場所が警察のための最低の高さを持っていました。各戦車小隊で最も高い乗務員を(典型的な歴史的最大高さルールを与えられ、通常は平均高さよりもはるかに低い)、それらの高さのサンプル標準偏差を見つけると、それらの高さは非常に小さくなるため、非常に小さくなる傾向があります境界にぶつかるようにします。
Glen_b-2017

質問で言語やツールが指定されていなかった場合、0.0は必ずしも小数点以下1桁に丸めたり切り捨てたりすることを示していません。0.0は、問題の言語が10進数/浮動小数点数として0を表示する方法です(一部の言語ではこれを行います)。
NotThatGuy 2017年

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.