統計は数学ではありませんか?


20

統計は数学ですか?

それはすべて数字であり、ほとんどが数学部門によって教えられており、数学のクレジットを取得していることを考えると、人々がそれを言うとき、それが数学のマイナーな部分であると言ったり、単に数学を適用しただけのように、冗談を言っているだけなのか疑問に思います。

基本的な公理に基づいてすべてを構築できない統計のようなものは、数学と見なすことができるのだろうか。たとえば、値は、データの意味を理解するために生まれた概念ですが、より基本的な原則の論理的な結果ではありません。p


10
強制XKCD参照:xkcd.com/435。とにかく、それは本当に重要ですか?
ニコ

2
(i)そのようなことをどのように定量化しますか?調査の対象になったわけではありません!(ii)計算にはほとんど常に数値が関係しますが、統計の理由は、私の考えでは、通常は計算にありません。(iii)学部の統計学を専攻したとき、それは数学科ではありませんでした。私が博士号を取得した場所は、2人のかなり有名な統計学者の下で、数学科でもありませんでした。(iv)冗談だとは思わない。これは非常に重要なアイデアに関連しています-統計を「統計」にするのは、特定のタイプの問題について推論する方法に関するものです。
-Glen_b

6
私は元純粋な数学者(PhDおよび何らかの代数で3.5年のポスドク)であり、現在は応用統計学者であるため、短い答えを与える義務を感じています...とき、私は使用しないレシピブックのような、ないような数学の数学者、ルックスのために、-test」またはものではありませんが。しかし、たとえば、van der Vaartの漸近統計は間違いなく数学の本です...中間レベルがたくさんあります-それらのいくつかは十分に人口がなく、私は多くの実際の例すべての数学の統計を説明する本が十分ではないと思います詳細。t
エルビス

5
「データの意味を理解するために生じた概念である値ですが、より基本的な原則の論理的な結果ではありません」というステートメントをどうすればよいのかわかりません。本当に正しいか間違っているかもしれません。ほとんどの場合、混乱した施設から進んでいるようです。p
GUNG -復活モニカ

12
@Guy同様に、化学(別の「数学の分野」)を漸近分布理論とC *代数として特徴付けることができます。そうすることは名目上は正確ですが、化学とは何かという本質と、化学者がそれを認識しないという目的を完全に見落とします。同様に、あなたの特徴づけを、主要な専門学会が統計と言っているものと比較してください:それらは世界的に離れています。「データから学習し、不確実性を測定、制御、伝達する科学。」確率の言及はありません。
whuber

回答:


15

数学は、(ほとんどの場合)絶対的な解決策を持つ理想化された抽象化を扱います。または、そのような解決策が存在しないという事実は、一般に完全に記述できます。単純な公理から複雑ではあるが必要な結果を発見する科学です。

統計では数学を使用しますが、数学ではありません。それは教育を受けた当て推量です。ギャンブルです。

統計は理想化された抽象化を扱いませんが(ツールとして一部を使用しますが)、現実世界の現象を扱います。統計ツールは、しばしば、仮定を単純化して、乱雑な実世界のデータを、解決された数学的抽象化の問題領域に適合するものに減らします。これにより、経験に基づいた推測を行うことができますが、統計情報はそれだけです。非常に十分な情報に基づいた推測を行う技術です。

p値を使用した仮説検定を検討してください。有意性仮説をテストしており、データを収集した後、p値0.001を見つけたとしましょう。そのため、対立仮説を支持して帰無仮説を棄却します。α=0.010.001

しかし、このp値は実際には何ですか?意味は何ですか?検定統計量は、特定の分布、おそらくスチューデントのtに適合するように開発されました。帰無仮説では、観測された検定統計量のパーセンタイルはp値です。言い換えると、p値は、観測された検定統計量として、分布の予想から離れた(またはより遠い)値を取得する確率を提供します。signficanceレベルはかなり任意の経験則カットオフです:に設定するこの実験の100回の繰り返しで1がNULLが実際に真である場合でも、我々はヌルを拒否することを示唆しているならば、それは許容だ」と言っ同等です。 」0.01

p値は、nullがtrueの場合に手元のデータを観察する確率を提供します(または、もう少し技術的になると、少なくとも極端な値を与えるnull仮説の下でデータを観察します)私たちが見つけたものとしてテストされた統計)。nullを拒否する場合、この確率を小さくして、ゼロに近づけます。特定の例では、帰無仮説が真である場合に収集したデータを観察する確率はわずかであるため、帰無を拒否しました。これは経験に基づいた推測でした。これらの方法を使用して帰無仮説が偽であることを確かに確信することは決してありませ。証拠がどれほど強力に代替案をサポートしているかの測定値を作成するだけです。0.1

p値の計算に数学を​​使用しましたか?はい。しかし、数学は私たちに結論を与えませんでした。証拠に基づいて、私たちは教育を受けた意見を形成しましたが、それでもギャンブルです。これらのツールは過去100年間で非常に効果的であることがわかりましたが、将来の人々は私たちの手法の脆弱性を恐ろしく思うかもしれません。


6
p値は、p1の計算に入らないH1にも依存するため、帰無仮説を棄却するときに間違っている確率ではありません(i.stack.imgur.com/tStr4 .png -H0が間違っており、太陽が爆発した確率は、p = 1/36よりもかなり低いです。
ディクラン有袋類

p値のよりシンプルな言語解釈を提案できますか?「nullが与えられたときに手元のデータを観察する確率は本当ですか」p値の例については、私が意図していたよりもずっと深く掘り下げました。私の意図は、p値の解釈に関するチュートリアルを提供するのではなく、統計について指摘することでした。脱線しすぎたくありません。いずれにしても、それを指摘してくれてありがとう。
デビッドマルクス

2
p値は、帰無仮説が真である場合に観測されるものと少なくとも同じくらい極端な結果の確率です。帰無仮説の妥当性とp値が論理的な必要性ではなく主に主観的であるというリンクは、良い点ですが(+1)。私は最近、頻繁な仮説検定が、少なくとも主観性がより明確にされるベイジアンアプローチよりも主観的ではないかと思っています。
ディクラン有袋類

あなたのp値の解釈/定義が前回のコメントで提供した代替案とどのように異なるかは私には明らかではありません。確かに、頻繁な仮説のテストにはある程度の主観性がありますが、ベイズ因子を解釈するときに呼び出されるのと同じ種類の主観性です。また、重要度レベルが伝達されない(つまり、ここでも主観が明示される)のではなく、慣例に基づいて選択されることがよくありますが、通常、(有益な)ベイズの優先順位を選択することにより多くの考えがあります。
デビッドマルクス

1
@David:「少なくとも同じくらい」は大きな違いをもたらします-ヌルの下で観測された値の確率は、それが理にかなっている個別のテスト統計でも、一般にp値ではありません。あなたが言っていたポイントに正接していることは知っていますが、ウィキペディアがそれを正しく理解できれば、Cross Validatedでできるはずです。
スコルチ-モニカの復職

10

頬の舌をしっかりと:

アインシュタインは明らかに書いた

数学の法則が現実を指す限り、それらは確実ではありません。そして、彼らが確かである限り、彼らは現実を参照していません。

したがって、統計は現実を記述する数学の分野です。; o)

論理が数学の枝であるのと同じように、統計は数学の枝であると思います。それは確かに哲学の要素を含んでいますが、それが当てはまる数学の唯一の分野ではないと思います(例えば、Morris Kline、「数学-確実性の喪失」、オックスフォード大学出版局、1980年を参照)。


2
あるロジックは、数学の枝?3値の論理とモード論理、または単に1次の述語計算を含む?すべての公式科学は何らかの形で数学ですか?
スコルチ-モニカの復職

一連の規則(形式言語など)に従って記号を操作するためのシステムの研究は、さまざまな数学であると考えているので、そうだと思います。ラベルの問題は、ラベルが適用されるすべてを常に完全に説明しているわけではないことです(私は正確に数学者、統計学者、またはコンピューター科学者であったとは言いませんが、3つすべての側面があります)。同様に、同じものを複数の階層に配置することもよくあります。そのため、この質問に対する独自の解決策はおそらくないでしょう。
ディクランマースピアル

あなたの議論の統計では、現実の説明として、幾何学と量子場の理論も含まれていますが、仮説検定は含まれていません(ほとんどの仮説は事実に反するため、偽造されることを意図しているため、明らかにそうでありません)「現実を記述する」)。
whuber

アインシュタインの引用はほっそりした舌であり、真剣に受け止めるつもりはありませんでした。アインシュタインが実際に念頭に置いていたものではないことを確信しています!
ディクラン有袋類

5

基本的な公理に基づいてすべてを構築することはできない統計のようなもの」と言うなら、おそらくコルモゴロフの公理確率論について読むべきでしょう。コルモゴロフは、確率論を抽象的かつ公理的に定義します。42ページのこのpdfまたは1ページ以降の次のページでご覧いただけます

彼の抽象的な定義の風味を与えるために、彼はここでより直感的な方法で説明されているように、「測定可能な」関数としてランダム変数を定義します:ランダム変数が関数である場合、どのように関数を定義しますかランダム変数

非常に限られた数の公理と(再び数学)メジャー理論からの結果を使用して、彼は概念をランダム変数、分布、条件付き確率、...抽象的に定義し、多数の法則のようなすべてのよく知られた結果を導き出すことができ、 ...この公理のセットから。試してみることをお勧めします。数学的な美しさに驚くでしょう。

p値の説明については、「p値の誤解?」を参照してください


1
しかし、確率論(数学)と推論の問題への応用(統計学)との間にはまだ重要な違いはありませんか?ベイジアンおよび頻度論的アプローチは、まったく異なる概念の確率で使用される同じ数学的な装置(通常またはほぼ)を示しています。
Scortchi -復活モニカ

@Scortchi:頻度の概念とベイジアンの確率の概念が異なるかどうかはわかりません。stats.stackexchange.com/questions/230415/…を

私のコメントとあなたの答えとの間に不一致は見られません。ベイジアン対頻繁な議論の数学根拠はありますか?。「数学的な装置」とは、コルモゴロフの公理から得られるものを意味します。「概念」とは、頻度、信念の程度を制限するものとしての解釈を意味します。
Scortchi-モニカの復職

3

私はこれに答えるための厳密なまたは哲学的な根拠はありませんが、私は「統計は数学ではない」という苦情をしばしば聞きます。人々は数学から確実性を保証したいので、統計は(通常)確率的な結論と関連するp値のみを提供すると思います。実際、これはまさに私が統計について好きなことです。私たちは根本的に不確実な世界に住んでおり、それを理解するために最善を尽くしています。そして、私たちはすべてを考慮して素晴らしい仕事をしています。


2

たぶん、私は貧乏で、高度な数学のコースを受講していないからですが、なぜ統計が数学ではないのかわかりません。ここでの議論と重複した質問に関する議論は、統計が数学ではない理由についての2つの主要なポイントを論じているようです*

  1. 正確/確実ではないため、前提に依存しています。
  2. 問題に数学を適用し、数学を適用するといつでも数学ではなくなります。

正確ではなく、仮定を使用

仮定/近似は、多くの数学に役立ちます。

小学校で学んだ三角形の特性は、非エルシディアン幾何学では成り立たないとしても、本当の数学と考えられています。したがって、数学のブランチへの制限の承認、または「XYZが有効であると仮定する」という別の方法で、ブランチが「真の」数学であることを失格にしないことは明らかです。

微積分は数学の純粋な形式と考えられますが、限界は私たちがそれを構築したコアツールです。サンプルサイズを大きくし続けることができるのと同じように、上限まで計算し続けることができますが、特定のしきい値を超えて洞察を増やすことはできません。

一度数学を適用すると、数学ではなくなります

ここで明らかな矛盾は、数学を使用して数学の定理を証明することであり、数学の定理を証明することは数学ではないと主張する人はいません。

次のステートメントthing xは、数学を使用して結果を取得する場合、数学ではないということです。それも意味がありません。

私が同意する声明は、あなたが計算の結果を使用して決定を下すとき、その決定は数学ではないということですそれは決定に至る分析が数学でないことを意味しません

統計分析を使用する場合、実行されるすべての数学は実際の数学です。 統計から数学を解くのは、解釈のために結果を誰かに渡すことだけです。 そのため、統計学と統計学者は実際の数学をやっており、実際の数学者です。数学ではないのは、ビジネスによって行われる解釈および/または統計学者によるビジネスへの結果の翻訳です。

コメントから:

whuberは言った:

「統計」を「化学」、「経済」、「工学」、または数学を使用する他の分野(家政学など)に置き換えた場合、議論は変わらないようです。

「化学」、「エンジニアリング」、「小切手帳のバランスをとる」ことの主な違いは、それらのフィールドが既存の数学的概念を使用しているだけだと思います。Guassのような統計学者が数学的概念の本体を拡張したことは私の理解です。私は、統計学の博士号を取得するためには、何らかの方法で数学的概念の本体を拡大することに貢献しなければならないと信じています(これは露骨に間違っているかもしれません)。化学/工学博士課程の候補者には、私の知る限り、その要件はありません。

統計が数学概念の本体に貢献するという区別は、単に数学概念を使用する他の分野からそれを区別するものです。


*:注目すべき例外は、さまざまな社会的理由により境界が人為的であることを効果的に示すこの回答です。私はそれが唯一の本当の答えだと思いますが、その楽しみはどこにありますか?;)


1
「統計」を「化学」、「経済」、「工学」、または数学を使用する他の分野(家政学など)に置き換えた場合、議論は変わらないようです。そのため、物質がないようです。
whuber

統計博士は「数学的概念の本体に貢献する」必要はありません。ほとんどの統計博士号は、統計手法統計理論への貢献に対して授与されます。(統計学の文献に注意を払う数学者はほとんどいません。それは一般に新しい、または実りのある数学的アイデアの良い情報源ではありません。ここでは確率論の文献を参照していません。)などは、しばしば彼らの作品の中に数学的なアイデアを作成します(または、通常、再作成します)。それは自動的にフィールドを数学の枝に変えません。
whuber

@whuberそれはとても興味深いです。足が立っていないように見えます。
エリック

1
記録のために、私はあなたの貢献を否定しませんでした。これは多くの人にとってデリケートなトピックです-たとえば、多くの大学の数学部門は、統計学者を数学者として扱い、両方を犠牲にしているため、いくつかの強い反応を引き出す可能性があります。
whuber

2
@whuberとにかく、いくつかのダウン投票に耐えるのは十分に難しい。:)あなたはいつも敬意を払っていたと思うので、心配しないでください。投票に加えて、理由のために匿名です。記録する必要はありません。
エリック

2

統計テスト、モデル、および推論ツールは数学の言語で定式化されており、統計学者はそれらについて非常に重要かつ興味深い結果の厚い本を数学的に証明しています。多くの場合、この証明は、問題の統計ツールが信頼性が高く強力であるという説得力のある証拠を提供します。

統計とそのコミュニティは、特定の趣味の数学者にとって「純粋」ではないかもしれませんが、数学に非常に深く投資されていることは間違いありません。


2
こんにちは、あなたが言うように、統計は素敵な定理と証明でいっぱいです(+1)、私の答えで説明するように、コルモゴロフによって開発された確率の公理もあります。

-2

帰納的推論:「違いは」に依存している演繹推論。たとえば、数学/定理では、データ/モデルに使用できる分布や事前分布を知ることはできません。

ところで、ベイジアン統計は公理化された領域です。


数学も帰納的推論を必要としています...
エルビス

はい@Elvis、なぜ私の例...私はあなたがこの質問への一般的な答えはありません知っているよということ...私は...あなたの喜びのために、答えを編集した
コンパイ・セグンド

私は本当にあなたのポイントを得ることができません。
エルビス

@CompaySegundo:ここに有効なポイントがあるかどうかはわかりませんが、少なくとも、明確に述べられていません。
QuoraのFeans

1
@QuoraFeaは、おそらく私が...あまりにも酔っています
コンパイ・セグンド

-2

これは非常に不評な意見かもしれませんが、統計学(および確率論)の概念の歴史と定式化を考えると、統計物理学のサブブランチであると考えます。

実際、ガウスは当初、天文予報の最小二乗回帰モデルを形式化しました。フィッシャー以前の統計への貢献の大部分は、物理学者(または、今日の基準では物理学と呼ばれる高度に応用された数学者)からのものでした。

包括的な原則は、測定されていない無数の変動源から伝播されたエラーと見かけのランダム性の特徴付けです。実験の制御が難しくなるにつれて、提案された数学的モデルに対する実験的証拠の優勢を調整するために、実験的誤差を正式に記述し、説明する必要がありました。後に、粒子物理学が量子物理学を掘り下げたとき、粒子をランダム分布として形式化することで、光子と電子で制御できないように見えるランダム性を記述するためのはるかに簡潔な言語が得られました。

平均(重心)や標準偏差(偏差の2次モーメント)などの推定量の特性は、物理学者にとって非常に直感的です。極限定理の大部分は、マーフィーの法則と大まかに関係している可能性があります。つまり、極限正規分布は最大エントロピーです。

したがって、統計は物理学のサブブランチです。


5
この論文は非論理的であると同時に信じがたい。スティーブンスティグラーが彼の本で指摘しているように、心理学者、経済学者、および他のほとんどの社会科学者は、物理学者の適用性と解釈につ​​いての本当の疑いにより、次の世紀まで物理学者の方法を採用しませんでした。これは、統計が物理学の分野をはるかに超えているという一応の証拠です。工学から生物学に至るまでのその他の学問分野も物理的手法と物理理論を採用していますが、物理学の分野でもありません。
whuber

確率に対するベルヌーイの関心は、物理学ではなくギャンブルに起因していませんか?
ディクラン有袋類

@whuber私の分野である生物統計学と同様に、これらの応用科学は科学分野として明確に特定される前にさまざまな形で存在していたことを強く認識しています。しかし、これらの分野は、統計分野自体が正式に先行していたと思います。もちろん、これは物理学の場合ではありません。これらの応用科学の中心的なテーマの1つは、何らかの予測因子を応答に関連付けるモデルとしてのプロセスの定式化です。おそらく統計の言語は、これらの分野に適用されるような概念を一般化する必要性から生まれたのかもしれません。
AdamO

1
あなたは、ars conjectandiの死後の著者であるJacobus Bernoulliについて考えています(ed。Nicholaus Bernoulli、1713)。おそらく、ギャンブルの問題に動機付けられたと思われる最後の人々は、1654年にパスカルとフェルマーでしたが、それでも、特定のギャンブルの問題(「問題点」)を動機付けの例としてのみ使用し、彼らの調査。(実際、現代の奨学金はイスラム契約法c。1200にポイントの問題をたどります。)ギャンブルによって本当に動機付けられた最後の注目すべき数学者は、おそらくカルダノ(1501-1576)でした。
whuber

1
魔術師ディアコニス?私はギャンブルとショーマンシップを混同しません!論点はありますが、多くの「投資家」が実際にギャンブラーであると示唆することで、少しだけ後退させることができます。とにかく、ホイヘンスが1657年に彼の小さな論文を発表した頃には、人々はギャンブルテーブルでうまくやるよりもはるかに深遠で広範囲の理由で確率の理論(および統計)を作成していたことは明らかです。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.