回答:
ウィキペディアから:
統計 [...]はサンプル(例えば、その算術平均値)のいくつかの属性の一つの尺度です。
そして
[A] n 推定量は、観測データに基づいて(基礎となる分布の)所定量の推定値を計算するためのルールです。
重要な違いは次のとおりです。
(「数量」の意味については、以下のセクションを参照してください。)
推定量は、ある統計を追加何かを持ちます。統計を推定量に変えるには、推定する目標量を入力するだけです。統計に「実際の」何かを追加するのではなく、一部のみが意図するため、これは混乱を招きます。
違いが重要であることを確認するには、単なる統計では推定器のプロパティ(バイアス、分散など)を計算できないことを理解する必要があります。バイアスを計算するには、統計から得られる値と真の値の差を見つける必要があります。推定値のみが、バイアスの計算を可能にする「真の値」を備えています。統計は単にデータの機能であり、正しいことも間違っていることもありません。
同じ統計に対して異なるターゲット量を綴り、異なる推定量を作成できます。これらの推定量にはそれぞれ独自のバイアスがありますが、それらはすべて(値に基づいて)同じ値、同じ統計値です。
したがって、「サンプル平均は不偏」と言っても意味がありません。サンプル平均を使用して分布平均を推定する場合、サンプル平均は不偏です。ただし、それを使用して分布の分散を推定する場合、バイアスがかかります。
ここで、量は分布の何らかの特性を指します。これは通常不明であるため、推定する必要があります。これは、サンプルのプロパティである統計とは対照的です。たとえば、分布平均は分布の量であり、サンプル平均は統計(サンプルの量)です。
このスレッドは少し古いですが、ウィキペディアの定義が変更されている可能性があり、正確であれば、それは私にとってより明確に説明しています:
「推定器」または「ポイント推定」は、統計モデルの未知のパラメーターの値を推測するために使用される統計(つまり、データの関数)です。
したがって、統計とは、データ自体とそのデータを使用した計算を指します。推定量はモデル内のパラメーターを指します。
私がそれを正しく理解していれば、平均値は統計値であり、推定値でもあります。サンプルの平均は統計(サンプルの合計をサンプルサイズで割ったもの)です。サンプルの平均は、正規分布していると仮定して、母集団の平均の推定量でもあります。
(新しい?)ウィキペディアの引用が正確である場合、私は@whuberおよびこのことを本当に知っている他の人に尋ねたいと思います。
それらが同じであると言う他の答えは信頼できる参照を与えないので、CasellaとBergerによるStatistical Inference Handbook から2つの引用を与えましょう:
定義5.2.1レッツ、サイズのランダムサンプルで集団からとletそのドメインのサンプル空間を含んでいる実数値またはベクトル値関数です 。次に、ランダム変数またはランダムベクトルはstatisticと呼ばれます。統計量の確率分布は、サンプリング分布と呼ばれます。 n T (x 1、… 、x n)(X 1、… 、X n)Y = T (X 1、… 、X n)Y Y
そして
定義7.1.1 Aのポイント推定器は、任意の関数であり、サンプルの、つまり、統計は点推定量です。
私はここでこれが質問に対する明確な答えだと言っているのではありません。違いがあることを示唆する2つの最も賛成の答えに同意するようで、これは反対ではないことを強調する参照を与えるだけです明確なケース。
「6」は推定量の例です。あなたの質問は、「xをyにマッピングする最適な線形関数の勾配は何ですか?」でした。あなたの答えは「6」です。または、ます。どちらも推定量です。どちらを選択するかは、決定する必要があります。
本当に良いTAは、かつて私に推定量の概念をそのように説明しました。
基本的に、推定量とは、値を知らない量を得るためにデータに適用するものです。統計の価値はわかっています。これは、データの関数であり、「最良」または「最適」なものではありません。「最良の」意味はありません。ただ平均があります。
所有するヤギの数と各人の幸福に関するデータセットがあるとします。あなたは、所有するヤギの数によって人々の幸福がどのように変わるかに興味があります。エスティメータは、データからその関係を推定するのに役立ちます。統計は、所有するデータの単なる機能です。たとえば、ヤギの所有権の分散は7になります。分散を計算するための公式は、ヤギとトースター間で同じであるか、幸福またはがんになる傾向に関心があるかどうかです。その意味で、すべての賢明な推定量は統計です。
興味深い質問。ただし、推定量と統計は異なるものである必要はありません。それらは異なる概念です。
統計は、入力が(統計)データである(広義の)関数です。その結果、この統計から結果(通常は数値)が得られます。より抽象的な用語では、統計は複数の数値を生成する場合があります。統計はデータに依存しますが、手順は決定的です。したがって、統計は「すべての数値を合計してカウントで除算する」か、より広い意味で「gdpデータを取得してレポートを作成する」のようになります。
統計的な意味では、もちろん、数学関数を統計として話しています。
これの重要性は、入力したデータのプロパティを知っている場合(たとえば、ランダム変数を使用している場合)、実際に経験的なデータを入力することなく、統計のプロパティを計算できることです。
推定量は、プロパティを推定するというあなたの意図による推定量です。判明したように、一部の統計は適切な推定値です。
たとえば、iid変数のプールからデータポイントを引き出す場合、算術平均(プルするデータに基づく統計)は、おそらくその分布の期待値の適切な推定量になります。ただし、推定値を生成するものは推定値です。
実際には、使用する推定量は統計になりますが、推定量ではない統計があります。たとえば、テスト統計-このステートメントのセマンティクスについて議論し、問題を悪化させることができますが、テスト統計には推定量が含まれるだけでなく、推定値も含まれる場合があります。概念的には、そうである必要はありませんが。
もちろん、統計値ではない推定値を使用することもできますが、推定値はあまり得意ではありません。
サンプルとは何かをよりよく理解することが役立つと思います。
[更新:サンプルは非常に広範な概念であり、「ランダムサンプル」について話していました。サンプルがランダムでない場合、推定量が意味をなすかどうかはわかりません。]
ウィキペディアから:
ランダムサンプルは、母集団の個々のメンバーがサンプルの一部として選択されるゼロ以外の既知の確率を持つサンプルとして定義されます。
推定量は、サンプルの関数です。サンプルは実際には()iidランダム変数のセットです。つまり、推定量は確率変数の関数でもあります。推定量は測定値を定義しますが、実際の測定値は定義しません。しかし、「観測データに基づいて特定の数量を推定するためのルール」と呼ぶことができます。特定の実験に基づいているため、 iidランダム変数に特定の値を設定できます。そして、sizeサンプルの特定の値を取得します。n n n n
推定器のサンプルをサンプルの値に置き換えます。推定量の値を取得します。これは特定の尺度です。そして、この特定の測定値は統計です。
(推定器の定義については、このリンクを確認してください。最後の文は、私たちが常に混乱している理由を明らかにしています。)
この執筆の目標:
ここでやりたいのは、「統計」と「推定器」と呼ばれる密接に関連する2つの概念の類似点と相違点を提供することです。ただし、パラメーターと統計量の違いを調べたくはありません。これは、統計量と推定量の違いに苦労しているすべての人にとって十分に明らかだと思います。そうでない場合は、最初に以前の投稿を勉強してから、この投稿の勉強を開始する必要があります。
関係:
基本的に、サンプル内の観測可能なランダム変数の実数値関数は統計と呼ばれます。うまく設計されていて、いくつかの優れた特性(一貫性など)を持っている場合、母集団の基本的な分布のパラメーターを推定するために使用できる統計がいくつかあります。したがって、統計は大きなセットであり、推定量は統計セット内のサブセットです。したがって、すべての推定量は統計量ですが、すべての統計量が推定量ではありません。
類似点:
前述のように、類似性について言えば、どちらもランダム変数の関数です。さらに、どちらにも「サンプリング分布」と呼ばれる分布があります。
違い:
違いといえば、彼らは彼らの目標とタスクの点で異なっています。統計の目標とタスクは、サンプル内の情報を要約すること(十分な統計を使用)、場合によっては仮説検定などを行うことがあります。調査対象の母集団のパラメーター。MOME、MLE、OLS推定器など、さまざまな推定器があり、それぞれに独自の計算ロジックがあります。これら2つの概念のもう1つの違いは、目的のプロパティに関係しています。統計の最も望ましい特性の1つは「十分」ですが、推定量の望ましい特性は「一貫性」、「不偏」、「精度」などです。
あぶない:
したがって、統計および推定量を扱うときは、用語を正しく使用することに注意する必要があります。たとえば、単なる統計値の偏りについて話すことはあまり意味がありません。これは、推定値ではありません。バイアスを計算できるようにするために、このようなコンテキストに関係するパラメーターがないためです。それについて話す。したがって、用語に注意する必要があります!
ボトムライン:
要約すると、サンプル内の観測可能なランダム変数の関数は統計量です。統計に母集団のパラメーターを推定する機能がある場合、それを(対象のパラメーターの)推定量と呼びます。ただし、パラメータを推定するように設計されていない統計があるため、これらの統計は推定ではなく、ここでは「単なる統計」と呼びます。
上記で提供したのは、これら2つの概念を見て、考える方法であり、私はそれを簡単な言葉で表現するように最善を尽くしました。私はそれが役立つことを願っています!
古いQに対する新しい答え:
定義1. Aの統計実数に各サンプルをマップする関数です。
すべての推定量は統計です。
ただし、推定値(「推定値」)を生成するために使用される統計のみを推定値と呼ぶ傾向があります。
したがって、たとえば、t統計とサンプル平均は両方の統計です。サンプル平均も推定量です(実際の母平均を推定するためによく使用するため)。
対照的に、パラメータを推定するために使用することはほとんどないため、t統計を推定器と呼ぶことはほとんどありません。
考えられる1つの方法を次に示します。サイコロを3回振る。
で仮説検定:
検定統計は、仮説検定に関するものです。検定統計量は、帰無仮説の下で与えられたランダム変数です。現在、一部のサンプルでは、統計を検定統計の値/測定と呼ぶ場合があります。
これら2つを使用すると、帰無仮説を棄却するか否かを判断するのに役立つ尺度であるp値を取得できます。全体として、統計とは、あなたの仮説にどれだけ近い/近いかの推定です。
このリンクは役に立つかもしれません。