正規分布は負の値を許可しませんか?
正しい。また、上限もありません。
私の教科書の一部では、正規分布は試験の得点をモデル化するのに適していると言っています。
前のステートメントにもかかわらず、これは時々そうです。テストに多くのコンポーネントがあり、あまり強く関連していない場合(たとえば、本質的に同じ質問が何十回もなかったり、各パートが前のパートに対して正しい答えを要求していない場合)、非常に簡単または非常に難しいわけではありません(ほとんどのマークが中央付近にあるように)、マークは通常正規分布でかなりよく近似される場合があります。多くの場合、通常の分析ではほとんど問題になりません。
我々は、彼らが正常でないことを確実に知る、それが自動的に問題ではない-私たちが使用するプロシージャの動作は、彼らは(我々の目的のために例えば標準誤差、信頼区間、有意水準がどうあるべきかに近い十分にある限りそして必要なものはどれでも-私たちが期待するものに近いことをしてください)
次のパートでは、自動車保険の請求をモデル化するのにどのような配分が適切かを尋ねます。今回は、正の値のみで連続しているため、適切な分布はガンマまたは逆ガウスになると述べました。
はい、しかしそれ以上です-それらは非常に右スキューになる傾向があり、平均が大きくなると変動性が増加する傾向があります。
車両クレームのクレームサイズ分布の例を次に示します。
https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg
(Garrido、Genest&Schulz(2016)の図5「保険金請求の依存頻度と重大度の一般化線形モデル」、Insurance:Mathematics and Economics、Vol 70、Sept。、p205-215。https ://www.sciencedirect。 com / science / article / pii / S0167668715303358)
これは、典型的な右スキューと重い右テールを示しています。ただし、これは限界分布であるため、非常に注意する必要があり、条件付き分布のモデルを作成しています。これは通常、スキューがはるかに少なくなります(クレームサイズのヒストグラムを混合するだけで見た場合の限界分布)これらの条件付き分布の)。それにもかかわらず、通常、予測変数のサブグループのクレームサイズ(連続変数を分類する場合)を見ると、分布は依然として非常に右に歪んでおり、右に非常に重いテールがあり、ガンマモデル*のようなものが示唆されますガウスモデルよりもはるかに適している可能性があります。
*ガウス分布よりも適切な他の分布がいくつあってもかまいません-逆ガウス分布は別の選択肢です-あまり一般的ではありません; 対数正規モデルまたはワイブルモデルは、GLMではありませんが、非常に便利です。
[これらの分布のいずれかがほぼ完璧な記述であるということはめったにありません。それらは不正確な近似値ですが、多くの場合、分析が有用であり、目的の特性に近いほど十分に優れています。]
まあ、試験の得点も正の値のみで連続するので、なぜそこに正規分布を使用するのでしょうか?
(前に述べた条件のもとでは、多くのコンポーネントが依存しすぎず、ハードでもイージーでもないため)分布は対称で、単峰性で、ヘビーテールではない傾向があるためです。