米国と英国の学校が標準偏差の異なる計算方法を教えるのはなぜですか?


15

私が理解しているように、英国の学校は標準偏差が以下を使用して発見されることを教えています:

代替テキスト

一方、米国の学校は以下を教えています。

代替テキスト

(とにかく基本的なレベルで)。

これは、インターネット上で検索したときに過去に多くの私の問題を引き起こしましたが、間違った説明を見つけました。

なぜ違いがあるのですか?

単純なデータセットで10個の値が指定されている場合、間違った方法が適用された場合(試験など)、どの程度のエラーが発生しますか?


4
どちらかを「間違った」式として特徴付けることが問題を理解する方法であるかどうかはわかりません。2番目のものは、真の標準偏差の公平な推定量であるという意味で、「より良い」ということです。したがって、偏りのない推定値に関心がある場合、2番目の推定値は「より良い」/「正しい」です。

シラバスで禁止されていない式を使用すると、試験で「間違った」答えになるという意味で、純粋に式を「間違った」と特徴付けていました。さらに、値が母集団のサンプルではない場合、最初の式がより正確な値を確実に提供します。
アモス

13
スリカント、私は2番目のものが公平な推定量だとは思わない。それの正方形がある真の分散の不偏推定量。ただし、ジェンセンの不等式は、確率変数の曲線関数の期待値が確率変数の期待値の関数と同じではないことを確立しています。したがって、2番目の式は、真の標準偏差の不偏推定量にはなりません。
アンドリューロビンソン

相互参照の場合:@ m.SE にも尋ねられました...
JMは統計学者ではありません

2
Freedman、Pisani、Purvesの非常に人気のある基本テキストを使用している米国の学校は、最初の式()を使用しているため、これを米国と英国の違いとして特徴付けることは間違っているようです。sn
whuber

回答:


18

最初の式は標準偏差で、2番目の式は標本標準偏差です。2番目の式は、分散の不偏推定量にも関連しています-詳細については、ウィキペディアを参照してください。

私は(ここで)英国では高校のサンプルと人口を区別していないと思います。彼らは確かに偏った推定量のような概念に触れない。


4
標準偏差の不偏推定量であるコリンは、一般的な場合、閉形式表現を持ちません。存在するのは、<i>分散</ i>(この場合はs <sup> 2 </ sup>)の不偏推定量です。両方とも母分散の一貫した推定量であることに注意してください。したがって、連続マッピング定理により、標準偏差の2つの推定量があります。関連する点は、s <sub> n </ sub> <sup> 2 </ sup>のMSEがs <sup> 2 </ sup>よりも低いことです。不偏を課すことによる追加の利点は議論の余地があります。
モーニングトン

@Tirthankar-私の非常にずさんな。答えを少し変更しました。ありがとう。
csgillespie

2
私が覚えている限り、GCSEの数学と科学(14〜16歳)で「サンプル」の計算を教えられ、Aレベルで母集団とサンプルの違いとそれらに関連する分散測定がカバーされました(詳細ではありません) 16〜18歳)。ですから、これが英国と米国の単純な違いであるかどうかはわかりません。
フレイアハリソン

11

最終的な質問、つまり2つの式の違いを定量化するための質問に誰もまだ答えていないため、それを処理しましょう。

多くの理由から、標準偏差を、差ではなく比率で比較することが適切です。比率は

sn/s=N1N=11N112N.

|(1/22)N2|1/(8N2)N2

N5N102つのデータセットのスプレッドを比較するときなどのSD。(データセットが同数である場合、不一致は事実上完全になくなり、両方の式は同一の結論につながります。)おそらく、これらは初心者に教えようとしている推論の形式です。これは、テキストまたはクラスが本当に重要なことを強調していないことの兆候と見なすことができます。

Ntzssn



5

これが純粋に米国対英国の問題かどうかはわかりません。ここに、標準偏差を計算するときにnとn-1を使用することの違い説明した短いページを示します。


1
私はそれを示唆していませんでした、なぜそのような違いが生じたのか、間違ったアドバイスに従うとどのようなレベルのエラーが生じるのか、生徒に与えることができる違いについて適切な説明があったのかについて興味がありました。
アモス

@harvey -リンクは死んでいる
baxx

3

Nはデータセット内のポイントの数であるため、平均を計算することにより、データセットの自由度が1つ減少したと主張できます(データセットに依存関係が導入されたため)。 -1は、前に平均を推定しなければならなかったデータセットから標準偏差を推定する場合。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.