私の理解では、記述統計はデータサンプルの特徴を定量的に記述し、推論統計はサンプルが抽出された母集団について推論しました。
ただし、統計的推論に関するウィキペディアのページには次のように記載されています。
ほとんどの場合、統計的推論は、ある種のランダムサンプリングを介して対象の母集団から抽出されたデータを使用して、母集団に関する命題を作成します。
「大部分」のために、おそらくこれらの概念を適切に理解していないと思うようになりました。人口について提案しない推論統計の例はありますか?
私の理解では、記述統計はデータサンプルの特徴を定量的に記述し、推論統計はサンプルが抽出された母集団について推論しました。
ただし、統計的推論に関するウィキペディアのページには次のように記載されています。
ほとんどの場合、統計的推論は、ある種のランダムサンプリングを介して対象の母集団から抽出されたデータを使用して、母集団に関する命題を作成します。
「大部分」のために、おそらくこれらの概念を適切に理解していないと思うようになりました。人口について提案しない推論統計の例はありますか?
回答:
行動科学のバックグラウンドから来て、私はこの用語を特に統計統計の入門書に関連付けます。このコンテキストでは、区別は次のとおりです。
重要な点は、統計的、推測的または記述的なものは、サンプルデータの関数であることです。パラメータは母集団の関数であり、母集団という用語は、基礎となるデータ生成プロセスを指すのと同じです。
この観点から、記述統計または推測統計としてのデータの特定の機能のステータスは、それを使用する目的によって異なります。
とは言っても、データの関連する特徴を説明するのに明らかに役立つ統計もあれば、推論を支援するのに適した統計もあります。
したがって、この観点から理解すべき重要なことは次のとおりです。
したがって、統計を使用して研究者の意図に基づいて記述と推測の区別を定義するか、通常の使用方法に基づいて統計を定義できます。
推論の1つの形式は、実験的な処理のランダムな割り当てに基づいており、母集団からのランダムなサンプリングではありません(仮説的にも)。オスカー・ケンプトホーンは支持者でした。
予測は、人口に関する命題を必ずしも定式化していない別の領域です。(誰もが予測を「推論」と呼びたいとは思いませんが、Geisser(1993)、Predictive Inference:An Introductionがあります)。多くの場合、当てはめられた母集団モデルから予測が続きますが、常にではありません。たとえば、@ Mattの分類例、モデル平均化(ベイジアンまたは赤池の重みに基づく)、指数平滑法などの予測アルゴリズム。
NB「推測統計と記述統計」は、サンプルから計算された量ではなく、専門分野の統計を指すことが多いと思います。推論統計と記述統計の間には本質的な違いはありません。@Jeremyが指摘したように、それをどのような用途に使用するかという問題です。
分類によって、データポイントの抽出元となる母集団について必ず声明が出されるかどうかはわかりません。おそらくご存知のように、分類では、それぞれが特定のクラスでラベル付けされた「機能」ベクトルで構成されるトレーニングデータを使用して、他のラベル付けされていない機能ベクトルに属するクラスラベルを予測します。たとえば、患者のバイタルサインと医師の診断を使用して、他の患者が健康か病気かを予測できます。
ただし、他の分類子は、クラス自体をモデル化せずにクラス間の違いを探します。これらは識別分類器と呼ばれます。古典的な例の1つに、最近隣分類子があります。これは、ラベルのない例を最近隣のクラスに割り当てます(問題に対して適切な方法で近いと定義されています)。これは、データポイントが抽出された母集団に関する情報があったとしても多く含まれているようには見えません。
1行で、データが与えられると、記述統計は情報の損失を最小限に抑えてデータの内容を要約しようとします(使用するメジャーに応じて)。データの地理を見ることができます(クラスのパフォーマンスグラフを見て、誰が一番上か一番下かなどを言います)
1行では、データが与えられると、データの出所である仮想母集団の特性を推定して推測しようとします。(基礎となる母集団が十分に大きく、全体として考慮することができないと仮定して、クラスの良いサンプルを通じて7年生の生徒を理解するようなもの)
要するに
記述統計は、意味のあるデータを記述、表示、または要約するデータの分析です。それは単に人口全体に関するデータ/話を記述する方法です。それらのいくつかは、中心傾向の測定と分散の測定です
推論統計は、サンプルを使用して、サンプルが抽出された母集団に関する一般化を行うことを可能にする手法です。
記述統計は、意味のあるデータを記述、表示、または要約するデータの分析です。それは単に人口全体に関するデータ/話を記述する方法です。それらのいくつかは、中心傾向の測定と分散の測定です
推論統計とは、サンプルを使用して、サンプルが抽出された母集団に関する一般化を行うことを可能にする手法です。仮説検定の例とこの回答の改善