正規分布は、CLTを学ぶまでは直感的ではないように見えます。これにより、CLTが実際にそれほど普及している理由がわかります。しかし、それはある量の「自然な」分布として発生するのでしょうか?
正規分布は、CLTを学ぶまでは直感的ではないように見えます。これにより、CLTが実際にそれほど普及している理由がわかります。しかし、それはある量の「自然な」分布として発生するのでしょうか?
回答:
ある程度、これは統計的な問題と同じくらい哲学的な問題かもしれないと思います。
自然に発生する現象の多くは、ほぼ正規分布しています。その根本的な原因がCLTのようなものであるかどうかを論じることができます。
人の身長は、多くの小さな原因(おそらく独立しており、同じように分布している可能性は低い)の合計と考えることができます:さまざまな骨の長さ、さまざまな遺伝子発現の結果、または多くの食事の影響の結果、または上記のすべての組み合わせ。
テストのスコアは、多くの個々のテストの質問のスコアの合計と見なすことができます(おそらく同じように分散され、完全に独立している可能性は低いです)。
流体内でのブラウン運動の結果として、粒子が1次元で移動する距離:運動は、分子によるIIDランダムヒットから生じるランダムウォークと抽象的に見なすことができます。
ただし、通常のx座標とy座標は、バックグラウンドでのCLT関連のメカニズムを正当化する可能性がある、ターゲティングの多くの小さな不正確さの合計と見なされる場合があります。
歴史的な意味では、天文観測をモデル化するために、二重指数(ラプラス)分布ではなく正規(ガウス)分布が広く使用されているのは、CLTが原因の可能性があります。このような観測の誤差をモデル化した初期の頃、ガウスとラプラスの間でそれぞれのお気に入りの分布について議論する議論がありました。さまざまな理由で、通常のモデルが勝っています。正規分布が最終的に成功する理由の1つは、CLTの通常の制限に基づく数学的便宜であったと主張できます。これは、どのディストリビューションファミリーがより良い適合性を提供するかが明確でない場合でも当てはまります。(今でも、「最高の観察」と感じている天文学者はまだいます細心の注意を払って尊敬されている天文学者によって作成されたものは、おそらく才能のあまりない観察者によって行われた多くの観察の平均よりも優れた値になるはずです。実際、彼らは統計学者による介入をまったく望まないでしょう。)
自然発生的な変数の多くは正規分布です。人間の高さ?動物のコロニーのサイズは?
rnorm(1)
。多項以外のすべての分布と同じです。