統計を1つの文で記述する方法は?


27

統計の学習を始めたとき、t検定、ANOVA、カイ2乗、線形回帰などの手順は、それぞれ非常に異なる生き物であるように見えました。しかし今では、これらの手順がそれぞれほぼ同じことをしていることに気付きました。同様に、分散、残差、標準誤差、平均などの値も、ほぼ同じことを測定します。

したがって、これらのすべての手順と値、そして実際にはすべての統計は、たった1つの簡単な文で説明できます。

期待される値は何ですか?また、この値の周りの変動は何ですか?

予想される単語は、これらの単語のいずれかに置き換えることができます:仮説、予測、中心

他の人は統計を1つの文でどのように説明しますか?


10
@Trynnaは、この説明は、はるかに狭すぎる:それは唯一の点推定を特徴付けます。それは数学を数の足し算や掛け算として説明するようなもので、これは数年間学校で算数を学んだ人の視点かもしれませんが、この分野の構成にはほど遠いです。
whuber

回答:


26

統計は、データを生成および理解するための理由と方法を提供します。

アメリカ統計協会


+1この概念に非常に近い何かの表現を考え出そうとしていました。データに基づいて結論を出すことについて何か付け加えたいと思いますが、それはそれほど簡潔ではありません。
グレン_b-モニカの復活

3
@Glenこの特徴づけには多くの思考が注がれたことがわかります。私たちのサイトのどこかにあるのが好きです。それと、機械学習の同様の簡潔な説明は、ヘルプページに属している必要があります。
whuber

2
引用に同意するかどうかはわかりません(それは素晴らしい願望ですが)。疫学者として、私は研究デザイン、データの生成、および私の周りの多くの優れた統計学者の研究の範囲外にあるその周辺の因果推論について知っていることを知っています。実際、再帰的因果グラフの派手な因果推論は、統計と名付けられていない3つの分野(疫学、コンピューターサイエンス、および社会学、私が理解しているように)に由来していました。これを好戦的な精神で育てることではありませんが、引用された文は科学の多くを説明しており、統計それ自体を特定していません。
アレクシス

3
ASAの説明は、人間の知識と活動の領域としての統計に関するものであり、「統計学者」が誰であるかを示すものではありません。WW2の専門統計家が希少になるまでは、それが統計が商業的および学術的な環境で適用されなかったことを意味しません。統計の適切な定義は、専門の統計学者が行うことに限定されるとは思わない。
シルバーフィッシュ

1
@Alexis 「理解」という言葉によって暗示される理解レベルには、おそらく難易度があります。ASAの定義では、簡潔さの点でかなり曖昧です。より広い解釈は、包括的すぎるかもしれません。確かに、「理解」の一部として実質的な物理的または社会的解釈と基礎となるメカニズムを含めると、「単なる」統計を超えます。一方、データからの推論が、因果関係であろうとなかろうと、科学的および統計的な取り組みの両方の領域内に収まらない理由は明らかではありません。
シルバーフィッシュ

13

統計は基本的にデータの構造の理解に関係しています。

ビル・ヴェナブルズとブライアン・リプリー、Sによる現代応用統計の第1章の最初の文


1
これは統計に関する興味深い見解ですが、限定的なものです。考えられる曖昧さが明らかになっています。コンピューター科学者は「データの構造」を非統計的に理解するでしょう。(VenablesとRipleyは、統計とコンピューティングの交差点で動作します。)
whuber

@whuber私はあなたに同意します。V&Rがすべての統計の1文の説明であることを意図していることを示唆するものは何もありませんが、最初に読んで以来、それは素晴らしい説明だと思いました。私は「データの構造」を「サンプルが採取された母集団の特性」と解釈します。
mark999

10

統計は、データを意味のある情報に変換するための推論と方法を提供します。



5

個人的に、私は死を伴うダイシングのスティーブン・センからの次の引用が好きです。チャンス、リスク、健康(ケンブリッジ大学出版局、2003)。段落全体を読む価値はありますが、私は彼の主なポイントを要約する一文(または二文)を強調しました。

統計があり、統計があります。
一般的な認識に反して、統計は単数であり、実際には事実に関するものではありません。それは、何かが事実であるということを私たちがどのように知り、疑い、信じるのかについてです。物事を知ることはそれらを数え、測定することを伴うので、統計の複数形は量的推論の科学である統計単数の懸念の一部であることは事実です。この科学は、会計よりも哲学(特に認識論)と共通しています。統計学者は応用哲学者です。哲学者は、何人の天使が針の頭で踊ることができるかと主張しています。統計学者それらを数えます。むしろ、おそらく何人が踊れるかを数えます。確率は問題の核心であり、量子物理学者が信じられるならば、すべての問題の核心です。統計学者に関する限り、これは真実です。アインシュタインが信じていたように世界が厳密に決定論的であるかどうか、または不確定性が残っているかどうかです。確実に何も予測することはできませんが、平均すると、予測がどれほど不確実になるかを予測できます。統計は、その方法を示す科学です。


5

統計は、データから学習し、不確実性を測定、制御、伝達する科学です。

マリー・ダビデアン&トーマス・ルイス

彼らは続けます:

; それにより、科学的および社会的進歩の過程を制御するために不可欠なナビゲーションを提供します


「不確実性」の側面を特定するため、この定義が気に入っています。統計はそれだけで存在するのではなく、より広い文脈で見る必要があると言うので、2番目の部分は素晴らしいです。ただし、完全に満足するためには、おそらくそれをASAにマージして、次のようにします。
Momo

1
データから学習し、不確実性を測定、制御、伝達する科学としての統計は、データを生成および理解するための推論と方法を提供します。
モモ

2

統計は、ノイズの多い情報から人々が明確な結論を下すのに役立つ方法と思考モードのキットバッグです。


2

私たちは神のようなすべてを知っている生き物ではないので、不確実性に対処する必要があり、統計はその不確実性を取り入れて反映する方法を提供します。


2

統計は、厳密な数学的概念を使用して、「観測からどのように学習するか」という次の質問を扱う哲学のサブフィールドです。

ちょうどサイドノートあなたは非常に長い「一文」にすることができ、一つの長い文で構成さB. Hrabalによって書かれた本、参照があります: 時代の高度のためのダンスレッスン



2

統計は、定量化された情報を正確で関連性のある方法で要約するための一連の論理原則と数学的な方法です。


1

自分自身の言葉で

Statistics is the science of what might be

これは一種の舌のようなものです。


1
最初の単語をマスクして空白を埋めるように頼むと、「統計」は最初に出てくるものではなく、おそらく2番目でも3番目でもないでしょう。「未来学」、「憶測」、「サイエンスフィクション」、そして多分-あなたの意図に少し近づいている-「予測」と「予測」は、おそらく人気のある選択でしょう。「ネオロジロジー」と「アポトロパリズム」でさえ可能性があります。:-)
whuber

1

フィッシャー(1922)は、次の引用文で統計の本質についての見解を述べました(1文の要件のために私が追加した太字のフォント):

統計問題の明確な定式化に到達するためには、統計学者が自分で設定するタスクを定義する必要があります:簡潔に、そして最も具体的な形で、統計的方法の目的はデータの削減です。通常は単なるバルクでは心に入ることができない大量のデータを、全体を適切に表す、または言い換えれば、可能な限り、理想的には全体を含む比較的少数のデータに置き換える、元のデータに含まれる関連情報。


0

結果指向の(そして実際には記述的ではない)ワンライナーは、私にとっては、

統計は、それが自然にとって同じことであるかどうかに関係なく、人間の世界を循環させるものです。


3
統計と政治を混同していますか?それとも愛を込めて?
whuber

@whuber(+1)いいえ。どちらも、気づいているかどうかにかかわらず、統計に基づいてほとんどの決定を行います。
アレコスパパドプロス

2
男性のリードがひざまずき、「赤ちゃん、あなたは私のUMVUEです。結婚してくれませんか?」:
whuber

@whuber(+2)...これは「気付かない」部分です。これは男性のリードが意味するもので、彼は言語を使用していませんが!(私はここで哲学的帝国主義の罪を犯すかもしれないと認めます)。
アレコスパパドプロス

2
少なくとも初期のソフィストまでさかのぼることができる、あなたの深く尊敬される文化的背景(あなたの名前と場所がそれを推測することを許す限り)は、その点でかなりの寛容さを可能にします。:-)
whuber

0

統計は、不確実なプロセスや確率的プロセスによるデータの生成をモデリングするためのツールです。


-1

統計とは、表示したいものをすべて告白するまでデータを十分に拷問することです。

私はロナルド・コースを言い換えています、リンクを見てください


-1、これは頬の舌として意図されていましたか?
GUNG -復活モニカ

@gung yes and no、私はRonald Coaseを引用していました。
ヴラディスラフドブガレス

3
ここのバージョンに基づいて、それはせいぜい悪い言い換えです。それは統計が何であるかの良い1文の要約ではありません。
GUNG -復活モニカ

3
@gungよく、OPは異なる人々がそれをどのように説明するか尋ねました。それは常に彼または彼女の視点または意見になります。人によって違います。OPは、私見でさまざまな意見を集めようとしました。
ヴラディスラフドブガレス

2
xeonは、回答を編集して属性を適切に引用し、提供することはCoaseにとって非常に親切です。
アレクシス

-2

統計は、一連の観測値の差がランダムであるかどうかを判断できる数理科学です。


1
フィールドが何であるかの狭いサブセットを説明します。
rolando2

違って見えます。最終的に、仮説テスト、回帰モデリング、またはその他の推定のいずれを実行する場合でも、推定値とナイーブモデルの差、または観測値の差が統計的に有意かどうかを最もよく測定します。私の文章は、統計的有意性対ランダム性の本質を捉えています。他の人が同意する場合、私にいくつかの投票をお願いできます。簡単に正当化できる私のコメントは、ある個人の狭さの主観的な解釈のために、単純な間違った答えとして扱われません。
Sympa

2
統計を使用して回答しようとすることが多いこれらのタイプの質問を検討してください。この分布の形は何ですか?これら2つの変数間の関係の性質は何ですか?一般的な問題/テーマ/トピック/ディメンションを確認できるように、これらの多くの変数をどのようにグループ化できますか?一般的なタイプ/プロファイルを確認できるように、これらの多くのケースをどのようにグループ化できますか?因果関係に目を向けて、この関係の網を説明する最良の方法は何ですか?この変数の経時的な傾向をキャプチャするものは何ですか?将来の価値を予測する最良の方法は何ですか?
-rolando2

これらの各ケースでは、これらの質問への回答には統計的有意性の強い要素があり、任意の形状または形式で見ているものと、まったくのランダム性によって発生する可能性があるものとが異なるかどうかを判断します。私たちのほとんどにとって、反対票は明らかに間違った答えを意味します。私の答えがどのように分類されるかわかりません。
-Sympa

1
下向き矢印の上にカーソルを合わせると、「この答えは役に立たない」と表示されます。私はそれが面白いと思うので、役に立たないわけではありません-それは考えさせられるからです。しかし、いくつかの理由でそれを支持していません。1つ目は、統計が「数学科学」であるという主張です。これは、統計は単なる数学の分岐であるという誤解(特に特定の数学者の間で)に不快に近いものです。2つ目は、2サンプルの仮説検定のみを特徴づけているように見えることです。これは、統計の非常に狭い(普及している)部分です。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.