テストスコアは本当に正規分布に従っていますか?


13

GLMでどのディストリビューションを使用するかを学習しようとしており、通常のディストリビューションを使用するタイミングについて少し混乱しています。私の教科書の一部では、正規分布は試験の得点をモデル化するのに適していると言っています。次のパートでは、自動車保険の請求をモデル化するのにどのような配分が適切かを尋ねます。今回は、正の値のみで連続しているため、適切な分布はガンマまたは逆ガウスになると述べました。まあ、試験の得点も正の値のみで連続するので、なぜそこに正規分布を使用するのでしょうか?正規分布は負の値を許可しませんか?


1
スコアの範囲が心配な場合は、en.wikipedia.org / wiki / Truncated_normal_distributionを
JG

5
現実の世界では、もちろん、試験のスコアの分布は、とにかく通常の分布のようには見えません。数学の学部時代の例として、私はTopology Iクラスを非常にバイモーダルな「ダンベルカーブ」グレード分布で悪名高いものとして覚えていました。幸運にもポイントを獲得できます。これらの両極端の中間のどこかで得点する人はほとんどいませんでした。
イルマリカロネン

2
いいえ。次の質問。
カールウィットソフト

回答:


14

たとえば、高さは通常、正常としてモデル化されます。男性の身長は5フィート10のようなもので、標準偏差は2インチです。負の高さは物理的ではないことがわかっていますが、このモデルでは、負の高さを観測する確率は本質的にゼロです。とにかくモデルを使用します。それは十分に良い近​​似だからです。

すべてのモデルが間違っています。問題は「このモデルはまだ有用か」であり、身長やテストスコアなどをモデリングする場合、非物理的なものを技術的に許容しているにもかかわらず、現象を通常どおりモデリングすることは有用です。


この特定のケースでは、正規分布が有用な近似であるかどうか疑問です。私が見たほぼすべてのグレード分布は、ある程度コメントで言及された二峰性曲線Ilmari Karonenに似ていました。(通常、最端ではなく0.6と0.9付近のモードを使用しますが)ただし、異なる平均値を持つ2つの正規分布の線形結合は、悪い近似にはなりません。
レイ

私は、法線が最高の近似であると主張していませんでした。私のコメントの全体のポイントは、最後の段落で本当に述べられています。少なくともこのレベルの抽象化では、実際のグレード分布の二峰性についてのコメントは実際には役に立たない。
デメトリパナノス

あなたの答えであなたが言ったことはすべて同意しますが、質問の一部は、正規分布が等級分布のモデリングに特に適用できるかどうかに関係しています。そして、その答えは通常「いいえ」です。すべてのモデルは間違っており、一部のモデルは有用ですが、一部のモデルは他のモデルよりも間違っており、あまり有用ではありません。特に、正規分布は、この問題のために特に悪い適合しているという事実は重要であり、それがあるとして、答えは通常であることを示唆しているようだだけで、実際にずっと深い問題がある場合、テールは負の無限行くので間違っています。
レイ

あなたはここで少し教訓的です。OPの問題は、通常では負のスコアが許可されることです。双峰性は問題ではありませんでした。この質問に関しては、木の森は見えません。現在、モデリングの詳細は関係ありません。
デメトリパナノス

10

正規分布は負の値を許可しませんか?

正しい。また、上限もありません。

私の教科書の一部では、正規分布は試験の得点をモデル化するのに適していると言っています。

前のステートメントにもかかわらず、これは時々そうです。テストに多くのコンポーネントがあり、あまり強く関連していない場合(たとえば、本質的に同じ質問が何十回もなかったり、各パートが前のパートに対して正しい答えを要求していない場合)、非常に簡単または非常に難しいわけではありません(ほとんどのマークが中央付近にあるように)、マークは通常正規分布でかなりよく近似される場合があります。多くの場合、通常の分析ではほとんど問題になりません。

我々は、彼らが正常でないことを確実に知る、それが自動的に問題ではない-私たちが使用するプロシージャの動作は、彼らは(我々の目的のために例えば標準誤差、信頼区間、有意水準がどうあるべきかに近い十分にある限りそして必要なものはどれでも-私たちが期待するものに近いことをしてください)

次のパートでは、自動車保険の請求をモデル化するのにどのような配分が適切かを尋ねます。今回は、正の値のみで連続しているため、適切な分布はガンマまたは逆ガウスになると述べました。

はい、しかしそれ以上です-それらは非常に右スキューになる傾向があり、平均が大きくなると変動性が増加する傾向があります。

車両クレームのクレームサイズ分布の例を次に示します。

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(Garrido、Genest&Schulz(2016)の図5「保険金請求の依存頻度と重大度の一般化線形モデル」、Insurance:Mathematics and Economics、Vol 70、Sept。、p205-215。https ://www.sciencedirect。 com / science / article / pii / S0167668715303358

これは、典型的な右スキューと重い右テールを示しています。ただし、これは限界分布であるため、非常に注意する必要があり、条件付き分布のモデルを作成しています。これは通常、スキューがはるかに少なくなります(クレームサイズのヒストグラムを混合するだけで見た場合の限界分布)これらの条件付き分布の)。それにもかかわらず、通常、予測変数のサブグループのクレームサイズ(連続変数を分類する場合)を見ると、分布は依然として非常に右に歪んでおり、右に非常に重いテールがあり、ガンマモデル*のようなものが示唆されますガウスモデルよりもはるかに適している可能性があります。

*ガウス分布よりも適切な他の分布がいくつあってもかまいません-逆ガウス分布は別の選択肢です-あまり一般的ではありません; 対数正規モデルまたはワイブルモデルは、GLMではありませんが、非常に便利です。

[これらの分布のいずれかがほぼ完璧な記述であるということはめったにありません。それらは不正確な近似値ですが、多くの場合、分析が有用であり、目的の特性に近いほど十分に優れています。]

まあ、試験の得点も正の値のみで連続するので、なぜそこに正規分布を使用するのでしょうか?

(前に述べた条件のもとでは、多くのコンポーネントが依存しすぎず、ハードでもイージーでもないため)分布は対称で、単峰性で、ヘビーテールではない傾向があるためです。


0

試験のスコアは、二項分布によってより適切にモデル化される場合があります。非常に単純化された場合、100点の正誤問題があり、それぞれ1ポイントに相当します。そのため、スコアは0〜100の整数になります。受験者の問題の正しさと相関関係がないと仮定した場合)、スコアは独立したランダム変数の合計であり、中央極限定理が適用されます。質問の数が増えると、正しい問題の一部が正規分布に収束します。

0未満の値については良い質問をします。100%を超える値についても同じ質問をすることができます。テスト問題の数が増えると、合計の分散が減少するため、ピークは平均に向かって引き寄せられます。同様に、最適な正規分布の分散は小さく、[0、1]区間の外側のpdfの重みは0になりますが、常にゼロではありません。「分数正解」の可能な値の間のスペースも減少します(100問で1 / 100、1000問で1/1000など)。したがって、非公式に、pdfは連続pdfのように振る舞います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.