平均0および標準偏差1の分布が常に使用されるのはなぜですか?


15

私の統計は独学で学んだが、私が読んだ多くの資料は、平均が0で標準偏差が1のデータセットを指し示している。

その場合は:

  1. なぜ平均0とSD 1が良い特性なのですか?

  2. このサンプルから引き出されたランダム変数が0.5に等しいのはなぜですか?0.001を描画する可能性は0.5と同じであるため、これはフラットな分布になるはずです...

  3. 人々がZスコアについて話すとき、彼らは実際にここで何を意味しますか?

回答:


11
  1. 最初に最も有用な答えは、おそらく0の平均と1のsdが数学的に便利であることです。平均が0で標準偏差が1の分布の確率を計算できる場合、非常に簡単な方程式を使用して、同様のスコア分布の確率を計算できます。

  2. 私はこの質問をフォローしていません。通常、0の平均と1の標準偏差は、通常ベル曲線と呼ばれる標準正規分布に適用されます。最も可能性の高い値は平均値であり、遠くなるにつれて低下します。本当にフラットな分布がある場合、他の値よりも高い価値はありません。ここでのあなたの質問の形式は不十分です。コインフリップについての質問を見ていましたか?二項分布と中心極限定理を調べます。

  3. 「ここを意味する」?どこ?Zスコアの簡単な答えは、平均が0で標準偏差が1であるかのようにスケーリングされたスコアであるということです。別の考え方は、スコアからの標準偏差の数として個々のスコアを取ることです。平均。方程式は(スコア-平均)/標準偏差を計算しています。これを行う理由は非常にさまざまですが、1つは、イントロ統計コースでは、さまざまなZスコアの確率の表があるためです(回答1を参照)。

ウィキペディアでさえ、最初にZスコアを調べた場合、かなり良い答えが得られたでしょう。


2)について、Xが連続確率変数である場合、混乱はp(X = .01)が意味するものであると信じています。直感的には、Xが正確に.01である可能性はないため、確率はどこでもゼロのようです。質問者は、累積的な密度関数の導関数として定義される連続的な場合の密度関数の定義を確認する必要があります。
トリスタン

7

ここで説明しているのは、標準正規分布、平均が0、標準偏差が1の正規分布です。標準正規分布として分布する変数の省略形はZです。

ここにあなたの質問に対する私の答えがあります。

(1)標準正規分布が魅力的である主な理由は2つあると思います。まず、各観測値を標準偏差で除算する前に、各観測値からその平均値を減算することにより、正規分布変数を標準正規値に変換または変換できます。これは、Z変換またはZスコアの作成と呼ばれます。これは、特にコンピューターの前の日に非常に便利です。

バツバツ¯σバツ=Z7565.610.2=0.9215

標準正規分布が頻繁に使用される2番目の理由は、Zスコアの観点から解釈されるためです。Z変換された変数の各「観測」は、元の変換されていない観測が平均からどれだけの標準偏差であったかです。これは、未加工のまたは絶対的なパフォーマンスが相対的なパフォーマンスよりも重要でない標準化されたテストに特に便利です。

(2)ここではフォローしません。累積分布関数とはどういう意味か混乱していると思います。標準正規分布の期待値は0であり、この値は関連する累積分布関数の.5の値に対応することに注意してください。

バツバツ¯σバツ=Z7565.610.2=0.9215
この場合のZスコアは0.9215です。Zスコアの解釈は、この特定の女性は平均身長よりも0.9215標準偏差高いことです。身長が55.4インチの人のZスコアは1で、平均身長より1標準偏差低くなります。

1

グラハムとジョンから素晴らしい説明を受けたので、最後の質問に答えます。

人々がZスコアについて話すとき、彼らは実際にここで何を意味しますか?

これに答える最良の方法は、この質問について考えることです。クラスCS 101の評点は通常、 μ = 80および σ = 5.グレード65のZスコアとは何ですか?

したがって:(65-80)/ 5 = -3

グレード65のZスコアは-3であると言えます。言い換えれば、左に3標準偏差です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.