記述統計と推測統計の違いは何ですか?


21

私の理解では、記述統計はデータサンプルの特徴を定量的に記述し、推論統計はサンプルが抽出された母集団について推論しました。

ただし、統計的推論に関するウィキペディアのページには次のように記載されています。

ほとんどの場合、統計的推論は、ある種のランダムサンプリングを介して対象の母集団から抽出されたデータを使用して、母集団に関する命題を作成します。

「大部分」のために、おそらくこれらの概念を適切に理解していないと思うようになりました。人口について提案しない推論統計の例はありますか?


記述統計:コインは10回投げられ、6回頭に落ちました。統計的推論:Headsの確率の最尤推定値は。または、この情報は、コインが公正なコインであるという仮説を拒否するには不十分です。0.6
サルウェートディリップ13年

2
「人口」という概念のない推論:データが(部分的に)未知のランダムなメカニズム/ルールによって生成されたと仮定します。推論方法を使用すると、データに基づいてこのメカニズムのプロパティを評価できます。例:近似的または不完全な条件下でのみ測定できる結果に基づいて、電気物理式を検証します。
マイケルM

1
@マイケル:はい。または実際に作る実験的治療の無作為割り当て-あなたのデータは、既知のランダムメカニズムによって生成されます。
Scortchi -復活モニカ

回答:


19

行動科学のバックグラウンドから来て、私はこの用語を特に統計統計の入門書に関連付けます。このコンテキストでは、区別は次のとおりです。

  • 記述統計 は、サンプルデータの機能であり、データの機能を説明する上で本質的に興味深いものです。古典的な記述統計には、平均、最小、最大、標準偏差、中央値、スキュー、尖度が含まれます。
  • 推定統計は、母集団パラメーターに関する仮説に関する推論を引き出すのに役立つサンプルデータの関数です。古典的な推測統計は、Z、T、含む等、F比を、χ2

重要な点は、統計的、推測的または記述的なものは、サンプルデータの関数であることです。パラメータは母集団の関数であり、母集団という用語は、基礎となるデータ生成プロセスを指すのと同じです。

この観点から、記述統計または推測統計としてのデータの特定の機能のステータスは、それを使用する目的によって異なります。

とは言っても、データの関連する特徴を説明するのに明らかに役立つ統計もあれば、推論を支援するのに適した統計もあります。

  • 推論統計: 帰無仮説が偽である特定のデータ生成プロセスについて、tやzのような標準テスト統計は、期待値がサンプルサイズに強く影響されます。ほとんどの研究者は、本質的に関心のある母集団パラメーターを推定するような統計を見ません。
  • 記述統計:対照的に、記述統計は、本質的に関心のある母集団パラメーターを推定します。たとえば、サンプルの平均と標準偏差は、同等の母集団パラメーターの推定値を提供します。最小値や最大値などの記述統計でさえも、同等または類似の母集団パラメーターに関する情報を提供しますが、もちろんこの場合、より多くの注意が必要です。さらに、多くの記述統計は偏っているか、理想的な推定量よりも少ない可能性があります。ただし、対象の母集団パラメーターの推定には、ある程度の有用性があります。

したがって、この観点から理解すべき重要なことは次のとおりです。

  • 統計:サンプルデータの機能
  • パラメータ:母集団の機能(データ生成プロセス)
  • estimator:パラメーターの推定値を提供するために使用されるサンプルデータの関数
  • 推論:パラメーターに関する結論に達するプロセス

したがって、統計を使用して研究者の意図に基づいて記述と推測の区別を定義するか、通常の使用方法に基づいて統計を定義できます。


推論統計(たとえばt- testではなく)tまたはF スコアを呼び出すことはどのように正当化されますか?
ジョナ

@jona tスコアはt検定で使用される「統計」であるため、このような推論プロセスの一部として使用される場合、tスコアは推論統計として説明できます。統計はデータの関数であるという仮定から始めたと思います。しかし、おそらく、推論統計を、推論を行うために使用されるより広範な技術のセットと考えることが多いという点をほのめかしていますか?
ジェロミーアングリム

別の言い方をしましょう-推論ステートメント(p値など)ではなく、t統計はサンプルの説明ではありませんか?
ジョナ

はい、データの機能はサンプルの説明と同等です。私はそのような統計が推論プロセスで使用されていると考えていたと思います(たとえば、研究者はt統計をt分布に関連付けてp値を取得し、pをアルファに関連付けて推論を引き出します)。私は教科書がこれらの例を使用するのをよく見ました。しかし、p値とバイナリ推論自体は統計(つまり、サンプルデータの関数)として見ることができると思います。また、バイナリ推論自体は、推論と最も明確に整合していると見なすことができます。それはあなたが得ているものですか?
ジェロミーアングリム

1
したがって、たとえば、データを使用して分布に関連するtを取得します。これにより、pが得られ、次に母集団パラメーターに関するバイナリ推論が生成されます。したがって、頻度主義の観点からは、t、p、およびバイナリ推論はすべてランダム変数です。全員が推論プロセスに関与していました。私は長所と短所がすべてまたは一部のそのような統計のみを推論としてラベル付けすることについてはわかりません。
ジェロミーアングリム

8

推論の1つの形式は、実験的な処理のランダムな割り当てに基づいており、母集団からのランダムなサンプリングではありません(仮説的にも)。オスカー・ケンプトホーンは支持者でした。

ABtt10/252=0.04

予測は、人口に関する命題を必ずしも定式化していない別の領域です。(誰もが予測を「推論」と呼びたいとは思いませんが、Geisser(1993)、Predictive Inference:An Introductionがあります)。多くの場合、当てはめられた母集団モデルから予測が続きますが、常にではありません。たとえば、@ Mattの分類例、モデル平均化(ベイジアンまたは赤池の重みに基づく)、指数平滑法などの予測アルゴリズム。

NB「推測統計と記述統計」は、サンプルから計算された量ではなく、専門分野の統計を指すことが多いと思います。推論統計と記述統計の間には本質的な違いはありません。@Jeremyが指摘したように、それをどのような用途に使用するかという問題です。


2

分類によって、データポイントの抽出元となる母集団について必ず声明が出されるかどうかはわかりません。おそらくご存知のように、分類では、それぞれが特定のクラスでラベル付けされた「機能」ベクトルで構成されるトレーニングデータを使用して、他のラベル付けされていない機能ベクトルに属するクラスラベルを予測します。たとえば、患者のバイタルサインと医師の診断を使用して、他の患者が健康か病気かを予測できます。

P(class=c|features)c

ただし、他の分類子は、クラス自体をモデル化せずにクラス間の違いを探します。これらは識別分類器と呼ばれます。古典的な例の1つに、最近隣分類子があります。これは、ラベルのない例を最近隣のクラスに割り当てます(問題に対して適切な方法で近いと定義されています)。これは、データポイントが抽出された母集団に関する情報があったとしても多く含まれているようには見えません。

t


0

1行で、データが与えられると、記述統計は情報の損失を最小限に抑えてデータの内容を要約しようとします(使用するメジャーに応じて)。データの地理を見ることができます(クラスのパフォーマンスグラフを見て、誰が一番上か一番下かなどを言います)

1行では、データが与えられると、データの出所である仮想母集団の特性を推定して推測しようとします。(基礎となる母集団が十分に大きく、全体として考慮することができないと仮定して、クラスの良いサンプルを通じて7年生の生徒を理解するようなもの)


3
情報の損失を最小限に抑えることを目的とするのは、記述統計の定義または特徴付けではないと思います。本当に重要な詳細を除外する記述統計を持つことは完全に可能であり、それはしばしば問題です。
ニックコックス

0

要するに

記述統計は、意味のあるデータを記述、表示、または要約するデータの分析です。それは単に人口全体に関するデータ/話を記述する方法です。それらのいくつかは、中心傾向の測定と分散の測定です

推論統計は、サンプルを使用して、サンプルが抽出された母集団に関する一般化を行うことを可能にする手法です。


0

記述統計は、意味のあるデータを記述、表示、または要約するデータの分析です。それは単に人口全体に関するデータ/話を記述する方法です。それらのいくつかは、中心傾向の測定と分散の測定です

推論統計とは、サンプルを使用して、サンプルが抽出された母集団に関する一般化を行うことを可能にする手法です。仮説検定の例とこの回答の改善


Cross Validatedへようこそ!ツアーをご覧ください。良い回答を終えようとしているように見えますが、何かが起こりました。自由に答えを編集して考えを完成させてください。また、ここに置いたものを共同編集する引用/参照を追加することにより、回答を改善することもできます。また、「母集団について提案しない推論統計の例はありますか?」という質問に答える必要があります。
タヴロック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.