標準偏差と標準偏差について素人に教える多くの練習をします。
TL; DR; それは、平均からの距離の平均のようなものです。(このような簡潔なバージョンでは少し混乱し誤解を招く恐れがあります。記事全体を読んでください)
私は素人が平均について知っていると思います。SDを把握し、エラーを推定することの重要性について説明します(以下のPSを参照)。それから私は、高度な数学や神聖な統計の知識は使わないことを約束します-単なるドライな推論と純粋な論理。
問題。温度計があるとしましょう(聴覚に近いものに応じて測定デバイスを選択します)。
同じ温度をN回測定した結果、温度計は36.5、35.9、37.0、36.6などを示しました(写真を参照)。実際の温度は同じであったことはわかっていますが、温度計は測定ごとに少しずつ異なります。
この小さなスカムがどれだけ私たちにあるかをどのように推定できますか?
平均を計算できます(下図の赤い線を参照)。信じられますか?平均化した後でも、ニーズに十分な精度がありますか?
最も簡単なアプローチ。最も遠い点を取り、その点と平均値(赤い線)の間の距離を計算し、これが温度計の位置だと言うことができます。推測できるかもしれませんが、最良の推定ではありません。写真を見ると、ほとんどのポイントは平均値付近にありますが、1ポイントだけでどのように決定できますか 実際には、そのような推定が粗く、通常は悪い理由で番号付けの理由を実践できます。
分散。その後...すべての距離を取り、平均距離を計算しましょう!
(xi−x¯)x¯xi
次に、平均距離の式がすべてを合計し、Nで割ると想像できます。
∑(xi−x¯)N
しかし問題がある。簡単に見ることができます。36.4と36.8は36.6から同じ距離にあります。しかし、上記の式に値を入れると、-0.2と+0.2が得られ、それらの合計は0になりますが、これは望んでいるものではありません。
サインを取り除く方法は?(この時点で、素人は通常「絶対値をとる」と言い、「絶対値をとるのは少し人工的だ、もう一つの方法は何か?」という提案を得る)。値を二乗できます!次に、式は次のようになります。
∑(xi−x¯)2N
この式は、統計では「分散」と呼ばれます。そして、最大距離をとるよりも、温度計(またはその他)の値の広がりを推定する方がはるかに適切です。
°C2°F2
∑(xi−x¯)2N−−−−−−−−−−√
σ
この時点で、素人は非常に明確に、ここに到達する方法と標準偏差/分散がどのように機能するかを理解します。この時点から、私は通常68〜95〜99.7のルールに進み、サンプリングと母集団、標準誤差と標準偏差の項などについても説明します。
PSトークの例を知ることの重要性:
1 000 000 ドルの測定装置があるとしましょう。そして、それはあなたに答えを与えます:42。あなたは42のために1 000 000 ドルを支払ったと思いますか?プーイ!その答えの精度に対して1000 000を支払った。なぜなら、価値-エラーを知らなくても費用はかかりません。値ではなく、エラーに対して支払います。ここに良い人生の例があります。
日常生活では、ほとんどの場合、定規を使用して距離を測定します。ルーラーは、約1ミリメートルの精度を提供します(米国にいない場合)。ミリメートルを超えて、0.1mmの精度で何かを測定する必要がある場合はどうなりますか?-おそらくキャリパーを使用します。今では、最も安い定規(まだミリ単位の精度)の価格はセントで、優れたキャリパーの価格は10分の1であることを確認するのは簡単です。1桁の精度に対して2桁の価格。そして、それはあなたがエラーに対して支払う金額の非常に一般的です。