なぜ正規分布に従う非常に多くの自然現象があるのか​​についての説明はありますか?


29

これは魅力的なトピックだと思いますが、完全には理解していません。非常に多くの自然現象が正規分布を持つように物理学の法則はどのようになっていますか?それらが均一に分布していると、より直感的に見えるでしょう。

これを理解するのは私にとって非常に難しく、いくつかの情報が欠けていると感じています。誰かが良い説明で私を助けたり、本/ビデオ/記事にリンクできますか?


これを確認してください。
アントニ・パレラダ

7
あなたの前提が実際にそうであると考える確固たる理由はありますか?
Glen_b-モニカを

4
実際、正規分布は本質的に「支配的な」分布ではない場合があります。極端に価値のある、ヘビーテールの、またはべき法則関数を記述する多くの現象と動作があります。彼の論文では、この分布クラスの経済・金融の変種の多くGabaix文書経済学のパワー法則:入門は、ここでは非ゲート... pages.stern.nyu.edu/~xgabaix/papers/pl-jep.pdf Shalizi、らal。この論文で経験的推定について議論します経験的データのべき法則分布、ここでは説明しません... santafe.edu/media/workingpapers/07-12-049.pdf
Mike Hunter

とにかく正規分布が支配的だと言ったのは誰ですか?
シャドウトーカー

1
@DJohnsonはリンクを+1しますが、重要なのはClauset et al。論文は、強く支持されている経験的べき法則分布があまり多くないということです!調査結果を引用して、「英語のテキストでの単語の出現頻度の分布の1つだけのケースでは、べき乗則は、データに非常に適合しており、他の選択肢は何も持たないという意味で、本当に説得力があるように見えます重量。"
シコラックスは、モニカの復活を

回答:


31

前提を否定することから始めましょう。彼は(1947年に)言った時ロバートゲーリーはおそらくケースを誇張しませんでした「...正規の神話であり、そこにいたことはありません、そして、正規分布になることはありませんでしょう。」 -
正規分布がモデルであります*、近似値は多かれ少なかれ有用です。

*(これについては、George Boxを参照してください。ただし、プロファイルにあるバージョンの方が好きです)。

いくつかの現象がほぼ正常であるということは、独立した[またはあまり強く相関していない効果]の合計が、それらの多くがあり、どれもが分散と比較して実質的な分散を持たない場合、分布を見ることができる残りの合計は、より正規に見える傾向があります。

n

もちろん、標準化された平均がほぼ正常であれば、標準化された合計は次のようになります。これが「多くの効果の合計」推論の理由です。そのため、変動にほとんど寄与しておらず、それらが高度に相関していない場合、あなたはそれを見る傾向があるかもしれません。

Berry-Esseenの定理は、iidデータの標準化されたサンプル平均で実際に起こっている(正規分布への収束)についてのステートメントを提供します(3番目の絶対モーメントが有限であることを必要とするため、CLTよりもやや厳しい条件の下で)それがどのくらいの速さで起こるかを教えてくれます。定理の後続のバージョンは、和の非同一分布のコンポーネントを処理しますが、正規性からの逸脱の上限はそれほど厳密ではありません。

あまり形式的ではないが、かなり良い分布をもつ畳み込みの振る舞いは、多くの場合、有限サンプルで公平な近似になる傾向があると疑う追加の(密接に関連する)理由を与えます。畳み込みは、さまざまなカーネルでカーネル密度推定を使用する人々がよく知っている一種の「スミアリング」演算子として機能します。結果を標準化すると(そのような操作を行うたびに分散は一定に保たれます)、繰り返し滑らかにすると、ますます対称的な丘の形状への進行が明確になります(カーネルを毎回変更しても問題はありません)。

Terry Taoは、中央極限定理とBerry-Esseen定理のバージョンについていくつかの素晴らしい議論をここで提供し、途中でBerry-Esseenの非独立バージョンへのアプローチに言及します。

それで、私たちがそれを見ると予想される状況の少なくとも1つのクラスと、それらの状況で本当に起こる傾向があると考える正式な理由があります。ただし、せいぜい「多くの効果の合計」の結果が正常であるという意味では、概算です。多くの場合、それは非常に合理的な近似です(さらに、分布の近似が近くない場合でも、正規性を前提とする一部の手順は、少なくとも大きなサンプルでは個々の値の分布に特に敏感ではありません)。

効果が「追加」されない他の多くの状況があり、他のことが起こると予想される場合があります。たとえば、多くの財務データでは、効果は乗法になる傾向があります(効果は、たとえば金利やインフレ率、為替レートなど、パーセンテージで金額を移動します)。そこでは、正規性は期待していませんが、ログスケールで正規性の大まかな近似を観察することがあります。他の状況では、大まかな意味でもどちらも適切ではありません。たとえば、通常、イベント間の時間は、ログの正常性または正常性のいずれかによって近似されることはありません。ここで議論する効果の「合計」も「生成物」もありません。特定の状況で特定の種類の「法」について何らかの議論をすることができる他の多くの現象があります。


12
+1。あなたの議論は、私の考えでは、もっともらしく、疑いなく、グループ思考のような質問への心理的な答えがあるかもしれないことを示唆し始めています:あなたの分野の誰もが正規分布を見たとき、あなたは誰と言いますか?これは特に、統計手順が歩行者用ツールと見なされ、おそらく出版のために論文を神聖化するために必要であるが、さもなければ固有の価値や関心がほとんどない調査分野に当てはまります。
whuber

2
具体的な例を挙げると、ケトレはBMI(Body Mass Index)を発明したときに、明示的に正規分布数量を生み出す方法でそれを行いました。ここではそのことについて話しました:stats.stackexchange.com/questions/64171/...
マット・クラウス

誰もがこの質問に答えるのではなく、この質問を避けようとしているように思えます。
デジオ

ギアリーは統計学者だったので、正常性が神話だと思ったのも不思議ではありません。彼が物理学者だった場合、彼は違った見方をしていました。
アクサカル

コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
Glen_b-モニカの復職

20

ポアンカレが語ったように、ガブリエル・リップマン(物理学者、ノーベル賞受賞者)による有名な格言があります。

[正規分布]は、厳密な控除では取得できません。その推定上の証明のいくつかはひどいです[...]。それにかかわらず、M。リップマンがいつか私に言ったように誰もがそれを信じています。なぜなら、実験者はそれを数学的定理であると想像し、数学者はそれを実験的事実であると想像するからです。

-アンリ・ポアンカレ、ルCalculがデProbabilités。1896

[Cette loi]賢明な教義はありません。プラスd'uneデモンストレーションqu'on a voulu en donner estgrossière[...]。ル・モンド・イ・クロワの代表者、私はM.リップマンを嫌っています、車の実験者は想像力のある数学的な方法、数学的な方法は実験的なものではありません。

List of Statistics Quotesスレッドにこの引用符がないので、ここに投稿するのが良いと思ったのはそのためです。


ダウン票?ここで誰かがポアンカレをひそかに嫌っていますか?
アメーバは、モニカーを復活させる

物理学の知識は高校で学んだことで終わりますが、ガウスはもともと物理学からの正規方程式の文脈で分布を研究していませんでしたか?ガウシアンエラーが一部の古典的な物理モデル
シャドートーカー

2
このボンモットの作者として、リップマンをもっと尊敬すべきです。ガブリエルリップマンは、ノーベル物理学賞を受賞しました。(ここでM.は単にムッシュ、自然を意味します。)
ニックコックス

3
@ssdecontrol覚えているように、ガウスは観測の通常のエラー、特に天文学と測地学に興味がありましたが、仮定が疑わしいことを知るのに十分賢明でした。(例えば、彼は1816年に拡散の抵抗力のある尺度として中央値からの絶対偏差の中央値を使用していました。)
ニックコックス

まあ、@ニック。明確にするために編集しました。
アメーバは、モニカ

7

非常に多くの自然現象が正規分布を持つように物理学の法則はどのようになっていますか?それらが均一に分布していると、より直感的に見えるでしょう。

正規分布は自然科学の一般的な場所です。通常、測定エラーで発生するのは、何らかの形式の大きな数値または中央極限定理(CLT)の推論によるものです。これは、通常、次のようになります。エラーが正常に分散されることを示唆しています。」たとえば、WJ Metzgerによるデータ分析の統計的手法からの抜粋です。

実際に測定するもののほとんどは、多くのrvの合計です。たとえば、テーブルの長さをルーラーで測定します。測定する長さは、光学視差、定規のキャリブレーション、温度、握手など、多くの小さな効果に依存します。デジタルメーターは、回路のさまざまな場所に電子ノイズがあります。したがって、測定するのは測定したいものだけでなく、多数の(できれば)小さな貢献をそれに加えます。この小さな貢献の数が多い場合、CLTはそれらの合計がガウス分布であることを示します。これがよくあるケースであり、通常、解像度関数がガウス関数である理由です。

ただし、当然のことながら、これはすべての分布が正常であることを意味するものではありません。たとえば、ポアソン分布は、カウントプロセスを扱う物理学で一般的です。分光法では、コーシー(別名Breit Wigner)分布を使用して、放射スペクトルの形状などを記述します。

これを書いた後、私はこれに気付きました。これまでに言及した3つの分布(ガウス、ポアソン、コーシー)はすべて安定分布であり、ポアソンは離散安定です。これについて考えたので、それは集約を生き残るための重要な分布の品質のようです。ポアソンから多数の数値を追加すると、合計はポアソンになります。これはなぜあるのか「説明する」かもしれません。

不自然な科学では、さまざまな理由で正規分布(またはその他の分布)を適用する際に非常に注意する必要があります。特に、相関関係と依存関係は、CLTの前提を破る可能性があるため、問題です。たとえば、金融では、多くのシリーズが通常のように見えますが、テールがずっと重いことがよく知られています。これはリスク管理の大きな問題です。

最後に、自然科学には、前述のような「手を振る」推論のようなものよりも、正規分布を持っているというより確かな理由があります。ブラウン運動を考えてみましょう。衝撃が真に独立しており、微小であれば、必然的に観測可能な経路の分布はCLTのために正規分布になります。たとえば、アインシュタインの有名な作品「ブラウン運動の理論に関する調査」の式(10)を参照してください。彼は、今日の名前を「ガウス」または「普通」と呼ぶことさえしませんでした。

ΔxΔpΔxΔp

したがって、異なる分野の研究者からガウス分布の使用に対する非常に異なる反応を得ることに驚かないでください。物理学などの一部の分野では、特定の現象が、膨大な量の観測に裏打ちされた非常に強固な理論に基づいてガウス分布に自然にリンクされることが期待されています。他の分野では、技術的な利便性、便利な数学的特性、またはその他の疑わしい理由により、正規分布が使用されます。


1
+1。見積りは合理的ですが、測定された長さは負にならない(つまり境界がある)ため、実際に正規分布に従うことはできませ。これは常に近似値です。
アメーバは、モニカーを復活させる

不自然な科学?フランケンシュタイン博士の見苦しい実験のようですか?;-)
SycoraxはReinstate Monicaのことを

1
@ user777、それはノーベル賞受賞者のランダウ冗談です:「科学は3つのタイプに分けることができます:自然、不自然、反自然」
-Aksakal

@Aksakal:この特定のリンクは間違っていると思います。Landauは、科学は(「сверхъестественные」の代わりに)「естественныеとнеестественныеипротивоестественные」に分けられると述べた。しかし、どのように翻訳するのか分かりません。
アメーバは、モニカーを復活させる

@amoeba、「неестественные」を「unnatural」と翻訳しています。「сверхъестественные」は「超自然的」だと思います。たぶんロシア人は私を修正することができます。
アクサカル

2

ここには非常に複雑な説明がたくさんあります...

私に関連した良い方法は次のとおりです。

  1. 1つのサイコロを振ると、各数字(1〜6)を振る可能性が等しくなります。したがって、PDFは一定です。

  2. 2つのサイコロを転がして結果を合計すると、PDFは一定ではなくなります。これは、36の組み合わせがあり、合計範囲が2〜12であるためです。2の尤度は、1 + 1の一意の特異な組み合わせです。12の尤度は、6 + 6の単一の組み合わせでのみ発生するという点でもユニークです。7を見ると、複数の組み合わせ、つまり3 + 4、5 + 2、および6 + 1(およびその逆順列)。中間値(7)から離れると、2と12の特異な組み合わせに到達するまで、6と8などの組み合わせは少なくなります。この例では、明確な正規分布は得られませんが、より多くのダイ追加し、より多くのサンプルを取得すると、結果は正規分布に向かう傾向があります。

  3. したがって、ランダムな変動(それぞれが独自のPDFを持つことができる)の影響を受ける一連の独立変数を合計すると、結果の出力は正常になります。シックスシグマの用語では、これを「プロセスの声」と呼んでいます。これは、システムの「一般的な原因の変動」の結果と呼ばれるものです。したがって、出力が正常に向かう傾向がある場合、このシステムを「統計的プロセス制御」と呼びます。出力が非正常(スキューまたはシフト)である場合、システムは何らかの原因で結果にバイアスをかけている「信号」が存在する「特別な原因の変動」の影響を受けると言います。

お役に立てば幸いです。


1

非常に多くの自然現象が正規分布を持つように物理学の法則はどのようになっていますか?

わからない。一方で、それが本当かどうか、あるいは実際に「非常に多く」が何を意味するのかもわかりません。

ただし、問題を少し再編成すると、正規分布の固定平均と分散を持っていると思われる連続量を想定する(つまり、モデル化する)正当な理由があります。これは、正規分布がこれらのモーメントの制約を受けるエントロピーを最大化した結果だからです。大まかに言えば、エントロピーは不確実性の尺度であるため、正規を最も非共同的または最大限不確実な分布形式の選択にします。

現在、既知の制約に従ってエントロピーを最大化することにより分布を選択するという考えは、実際にそれらを実現するための可能な方法の数に関していくつかの物理的裏付けを持っています。ここでは、統計力学のジェインズが標準的なリファレンスです。

この場合、最大エントロピーは正規分布を動機付けますが、さまざまな種類の制約が異なる分布族、例えば、おなじみの指数、ポアソン、二項などにつながることが示されることに注意してください。

Sivia and Skilling 2005 ch.5には直感的な議論があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.