推定量と統計量の違いは何ですか?


30

統計はサンプルから取得できる属性であることを学び、同じサイズの多くのサンプルを取得し、それらすべてについてこの属性を計算し、pdfをプロットすると、対応する属性の分布または対応する統計の分布が得られます。

また、統計は推定量になるように作られていると聞きましたが、これら2つの概念はどのように異なるのですか


2
すべてanswearsのおかげで...コンセプトは...今、私にはもっとたくさん明確である
gutto

回答:


17

定義

ウィキペディアから:

統計 [...]はサンプル(例えば、その算術平均値)のいくつかの属性の一つの尺度です。

そして

[A] n 推定量は、観測データに基づいて(基礎となる分布の)所定量の推定値を計算するためのルールです。

重要な違いは次のとおりです。

  • 統計は、サンプルの関数です。
  • 推定器は、サンプルの関数であり、分布のいくつかの量に関連します

(「数量」の意味については、以下のセクションを参照してください。)

統計は推定量ではありません

推定量は、ある統計を追加何かを持ちます。統計を推定量に変えるには、推定する目標量を入力するだけです。統計に「実際の」何かを追加するのではなく、一部のみが意図するため、これは混乱を招きます。

違いが重要であることを確認するには、単なる統計では推定器のプロパティ(バイアス分散など)を計算できないことを理解する必要があります。バイアスを計算するには、統計から得られる値と真の値の差を見つける必要があります。推定値のみが、バイアスの計算を可能にする「真の値」を備えています。統計は単にデータの機能であり、正しいことも間違っていることもありません。

同じ統計に基づく異なる推定量

同じ統計に対して異なるターゲット量を綴り、異なる推定量を作成できます。これらの推定量にはそれぞれ独自のバイアスがありますが、それらはすべて(値に基づいて)同じ値、同じ統計値です。

  • 分布平均の推定量としてサンプル平均を使用できます。この推定器のバイアスゼロです。
  • 分布の分散の推定量としてサンプル平均を使用することもできます。この推定量は、ほとんどの分布に対して偏っています。

したがって、「サンプル平均は不偏」と言っても意味がありません。サンプル平均を使用して分布平均を推定する場合、サンプル平均は不偏です。ただし、それを使用して分布の分散を推定する場合、バイアスがかかります。

分布の量とサンプルの量

ここで、は分布の何らかの特性を指します。これは通常不明であるため、推定する必要があります。これは、サンプルのプロパティである統計とは対照的です。たとえば、分布平均分布の量であり、サンプル平均は統計(サンプルの量)です。


1
これらの引用には明白な問題はありませんが、「量」が正確に何を意味するのか、私は戸惑っています。たとえば、引用は、「数量」が同じデータに基づく別の統計であるか、またはおそらく同様のデータの別のセットに基づく別の統計である可能性を除外するようには見えません。(後者の場合、最初の統計が予測子として使用される可能性があります前者の場合、名前はないと思いますが、「
推定子

@whuber編集を参照してください。最初に短い答えをしたかった
::

分布は...中央値=が意味するものであればおそらくサンプル平均とサンプルの中央値は、同じ基本的な値を推定します
太いジョー・ピート

私の批判はあなたの編集の観点からはあまり意味がありません。多くの分布では、中央値!=平均であるため、サンプル中央値とサンプル平均は、このような場合に同じ値に収束しません(つまり、同じものを推定しない)。
スタンピージョーピート

1
@Stumpyあなたはここで少し誤解していると思います。中央値と平均値が同じもの(またはまったく)に「収束」するかどうかは関係ありません。これを明確にするために、少しばかげた話をしましょう。必要に応じて、サンプル分散を使用して平均を推定できます。理論的な制限は全くありません-あり得ません-それは私がこれを行うことができないと言います。私の手順は、定義のすべての部分を満たします。サンプルの分散は本当に統計量であり、平均は基本的な分布の特性です。定義については、これが(多くの場合)ひどい手順であることは無関係です。
whuber

15

このスレッドは少し古いですが、ウィキペディアの定義が変更されている可能性があり、正確であれば、それは私にとってより明確に説明しています:

「推定器」または「ポイント推定」は、統計モデルの未知のパラメーターの値を推測するために使用される統計(つまり、データの関数)です。

したがって、統計とは、データ自体とそのデータを使用した計算を指します。推定量はモデル内のパラメーターを指します。

私がそれを正しく理解していれば、平均値は統計値であり、推定値でもあります。サンプルの平均は統計(サンプルの合計をサンプルサイズで割ったもの)です。サンプルの平均は、正規分布していると仮定して、母集団の平均の推定量でもあります。

(新しい?)ウィキペディアの引用が正確である場合、私は@whuberおよびこのことを本当に知っている他の人に尋ねたいと思います。


6
+1基本的に正しいと思います。推定器のターゲットは、必ずしもモデルの特定の「パラメーター」である必要はないことを知りたい場合があります。パラメーターの関数など、モデルの任意のプロパティを指定できます。たとえば、はNormalモデルのパラメーターではありませんが、推定できます。μ σ 2μ2(μ,σ2
whuber

5

それらが同じであると言う他の答えは信頼できる参照を与えないので、CasellaとBergerによるStatistical Inference Handbook から2つの引用を与えましょう:

定義5.2.1レッツ、サイズのランダムサンプルで集団からとletそのドメインのサンプル空間を含んでいる実数値またはベクトル値関数です 。次に、ランダム変数またはランダムベクトルはstatisticと呼ばれます。統計量の確率分布はサンプリング分布と呼ばれます。 n T x 1x nX 1X nY = T X 1X nY YX1,バツnnTバツ1バツnバツ1バツnY=Tバツ1バツnYY

そして

定義7.1.1 Aのポイント推定器は、任意の関数であり、サンプルの、つまり、統計は点推定量です。Wバツ1バツn

私はここでこれが質問に対する明確な答えだと言っているのではありません。違いがあることを示唆する2つの最も賛成の答えに同意するようで、これは反対ではないことを強調する参照を与えるだけです明確なケース。


4

「6」は推定量の例です。あなたの質問は、「xをyにマッピングする最適な線形関数の勾配は何ですか?」でした。あなたの答えは「6」です。または、ます。どちらも推定量です。どちらを選択するかは、決定する必要があります。 (XX)1XY

本当に良いTAは、かつて私に推定量の概念をそのように説明しました。

基本的に、推定量とは、値を知らない量を得るためにデータに適用するものです。統計の価値はわかっています。これは、データの関数であり、「最良」または「最適」なものではありません。「最良の」意味はありません。ただ平均があります。

所有するヤギの数と各人の幸福に関するデータセットがあるとします。あなたは、所有するヤギの数によって人々の幸福がどのように変わるかに興味があります。エスティメータは、データからその関係を推定するのに役立ちます。統計は、所有するデータの単なる機能です。たとえば、ヤギの所有権の分散は7になります。分散を計算するための公式は、ヤギとトースター間で同じであるか、幸福またはがんになる傾向に関心があるかどうかです。その意味で、すべての賢明な推定量は統計です。


3

興味深い質問。ただし、推定量と統計は異なるものである必要はありません。それらは異なる概念です。

統計は、入力が(統計)データである(広義の)関数です。その結果、この統計から結果(通常は数値)が得られます。より抽象的な用語では、統計は複数の数値を生成する場合があります。統計はデータに依存しますが、手順は決定的です。したがって、統計は「すべての数値を合計してカウントで除算する」か、より広い意味で「gdpデータを取得してレポートを作成する」のようになります。
統計的な意味では、もちろん、数学関数を統計として話しています。

これの重要性は、入力したデータのプロパティを知っている場合(たとえば、ランダム変数を使用している場合)、実際に経験的なデータを入力することなく、統計のプロパティを計算できることです。

推定量は、プロパティを推定するというあなたの意図による推定量です。判明したように、一部の統計は適切な推定値です。
たとえば、iid変数のプールからデータポイントを引き出す場合、算術平均(プルするデータに基づく統計)は、おそらくその分布の期待値の適切な推定量になります。ただし、推定値を生成するものは推定値です。

実際には、使用する推定量は統計になりますが、推定量ではない統計があります。たとえば、テスト統計-このステートメントのセマンティクスについて議論し、問題を悪化させることができますが、テスト統計には推定量が含まれるだけでなく、推定値も含まれる場合があります。概念的には、そうである必要はありませんが。

もちろん、統計値ではない推定値を使用することもできますが、推定値はあまり得意ではありません。


1
その最後の文について少し詳しく説明していただけますか?たとえば、サイズ iidサンプルを考えます。コインフリップを使用してサンプルの番目と番目の最大値から選択することにより、母集団の中央値を推定します。それは「決定論」の手順(それががないので、あなたの定義によれば、これは、統計ではないです一般的な、より一般的な定義による統計)。また、かなり良い推定量でもあります。ですから、「統計」ではない「推定器」を参照するときに、どんな種類のオブジェクトを念頭に置いているのかと思っています。n n + 12nnn+1
whuber

ええ、「値の選択」は決定論的な統計であり、事前にすべてが選択したサンプルの変更に関連していると主張します。再び「手順」が決定的であるため、統計の定義でこのような確率的要素を許可するだけです。統計ではない推定量は、少なくともデータに依存しない推定量である可能性があります。たとえば、以下の回答の数字「6」。非統計的推定量が必ずしも悪いとは言わなかったことに注意してください。
IMA

1
おそらくあなたは不必要な細かい区別をしすぎており、最終的には説明が複雑になっていると思います。たとえば、「1/2」はベルヌーイ変数のパラメーターの優れた推定量であり(2次損失のミニマックスです)、データから独立しているという理由だけで除外するのは残念です。(これは、ユークリッド幾何学の長方形の例として正方形を除外することに似ています:それはできますが、それは長方形のプロパティに関するほとんどのステートメントの長さを2倍にします。)同様に、ランダム化された統計を除外しないのに役立ちます。
whuber

私たちは本当に同じことについて話しているとは思わない。どこで何かを排除できますか?半分が優れた推定量である場合は、そうです。統計を無視していない可能性のある推定量の大部分がかなり素晴らしいとは思わない。ベルヌーイ変数の場合、「1/2」が適切です。しかし、「実数」クラスの他のいくつかの推定量はあまり良くありません、あなたは同意しませんか?まだデータに基づいたランダム化された統計の問題については、決定論的な手順が必要になると言うので、私はそれを除外しませんでした。しかし、私はこれを上記に追加すべきだと認めます。
IMA

2

サンプルとは何かをよりよく理解することが役立つと思います。

[更新:サンプルは非常に広範な概念であり、「ランダムサンプル」について話していました。サンプルがランダムでない場合、推定量が意味をなすかどうかはわかりません。]

ウィキペディアから:

ランダムサンプルは、母集団の個々のメンバーがサンプルの一部として選択されるゼロ以外の既知の確率を持つサンプルとして定義されます。

推定量は、サンプルの関数です。サンプルは実際には()iidランダム変数のセットです。つまり、推定量は確率変数の関数でもあります。推定量は測定値を定義しますが、実際の測定値は定義しません。しかし、「観測データに基づいて特定の数量を推定するためのルール」と呼ぶことができます。特定の実験に基づいているため、 iidランダム変数に特定の値を設定できます。そして、sizeサンプルの特定の値を取得します。n n n nnnnnn

推定器のサンプルをサンプルの値に置き換えます。推定量の値を取得します。これは特定の尺度です。そして、この特定の測定値は統計です。

(推定器の定義については、このリンクを確認してください。最後の文は、私たちが常に混乱している理由を明らかにしています。)


1

この執筆の目標:

ここでやりたいのは、「統計」と「推定器」と呼ばれる密接に関連する2つの概念の類似点と相違点を提供することです。ただし、パラメーターと統計量の違いを調べたくはありません。これは、統計量と推定量の違いに苦労しているすべての人にとって十分に明らかだと思います。そうでない場合は、最初に以前の投稿を勉強してから、この投稿の勉強を開始する必要があります。

関係:

基本的に、サンプル内の観測可能なランダム変数の実数値関数は統計と呼ばれます。うまく設計されていて、いくつかの優れた特性(一貫性など)を持っている場合、母集団の基本的な分布のパラメーターを推定するために使用できる統計がいくつかあります。したがって、統計は大きなセットであり、推定量は統計セット内のサブセットです。したがって、すべての推定量は統計量ですが、すべての統計量が推定量ではありません。

類似点:

前述のように、類似性について言えば、どちらもランダム変数の関数です。さらに、どちらにも「サンプリング分布」と呼ばれる分布があります。

違い:

違いといえば、彼らは彼らの目標とタスクの点で異なっています。統計の目標とタスクは、サンプル内の情報を要約すること(十分な統計を使用)、場合によっては仮説検定などを行うことがあります。調査対象の母集団のパラメーター。MOME、MLE、OLS推定器など、さまざまな推定器があり、それぞれに独自の計算ロジックがあります。これら2つの概念のもう1つの違いは、目的のプロパティに関係しています。統計の最も望ましい特性の1つは「十分」ですが、推定量の望ましい特性は「一貫性」、「不偏」、「精度」などです。

あぶない:

したがって、統計および推定量を扱うときは、用語を正しく使用することに注意する必要があります。たとえば、単なる統計値の偏りについて話すことはあまり意味がありません。これは、推定値ではありません。バイアスを計算できるようにするために、このようなコンテキストに関係するパラメーターがないためです。それについて話す。したがって、用語に注意する必要があります!

ボトムライン:

要約すると、サンプル内の観測可能なランダム変数の関数は統計量です。統計に母集団のパラメーターを推定する機能がある場合、それを(対象のパラメーターの)推定量と呼びます。ただし、パラメータを推定するように設計されていない統計があるため、これらの統計は推定ではなく、ここでは「単なる統計」と呼びます。

上記で提供したのは、これら2つの概念を見て、考える方法であり、私はそれを簡単な言葉で表現するように最善を尽くしました。私はそれが役立つことを願っています!


0

古いQに対する新しい答え:

定義1. Aの統計実数に各サンプルをマップする関数です。

すべての推定量は統計です。

ただし、推定値(「推定値」)を生成するために使用される統計のみを推定値と呼ぶ傾向があります。

したがって、たとえば、t統計とサンプル平均は両方の統計です。サンプル平均も推定量です(実際の母平均を推定するためによく使用するため)。

対照的に、パラメータを推定するために使用することはほとんどないため、t統計を推定器と呼ぶことはほとんどありません。

PQ

_

θ

θ

考えられる1つの方法を次に示します。サイコロを3回振る。

s=バツ1バツ2バツ3バツ1バツ2バツ3

s1=541s2=416s3=632

PQPQs=バツ1バツ2バツ3

Ps=バツ1lnバツ2+バツ3
Qs=バツ1+バツ2+バツ33

P

Qθ

Pθ


1
この答えは良い方向に向かっています。ただし、「定義2」は、その循環性のために有効な定義ではないようです(後者を説明せずに「推定」という用語で「推定器」を定義します)。それが効果的であるためには、「パラメータの推定値」が十分に詳細かつ明快であることを説明する必要があり、人々は推定器がどれだけうまく機能するかを定量的に測定できます。
whuber

θθ5

2
残念ながら、私が提案しようとしていたように、2番目の定義では推定量と他の統計量をまったく区別していないため、簡素化で重要なものが失われたようです。
whuber

@whuber:そうです。正式には、推定量は単なる統計です。しかし、統計が何らかの関心のあるパラメータを推定するために使用される場合、統計を指すために「推定子」という言葉を使用する傾向があります。この点を明確にするために回答を編集しました。
ケニーLJ

-3

仮説検定

検定統計は、仮説検定に関するものです。検定統計量は、帰無仮説の下で与えられたランダム変数です。現在、一部のサンプルでは、​​統計を検定統計の値/測定と呼ぶ場合があります。

これら2つを使用すると、帰無仮説を棄却するか否かを判断するのに役立つ尺度であるp値を取得できます。全体として、統計とは、あなたの仮説にどれだけ近い/近いかの推定です。

このリンクは役に立つかもしれません。


2
推定ではなく仮説検定に関連する別の質問に取り組んでいるようです。「統計」の定義は、標準定義よりも範囲がはるかに制限されています。統計は、非常に限られた仮説検定や帰無仮説の場合だけでなく、あらゆる形態の意思決定に適用されます。さらに、仮説検定は推定量と同じではなく、ほとんどの統計は、いくつかの仮説に近い推定量として使用されません。
whuber

別の質問だとは言いません。少なくとも仮説検定の文脈でそれが何であるかについての写真を提供します!
dfhgfh

2
この回答は、質問の限定的かつ専門的なバージョンに焦点を合わせており、読者にその事実を警告することなく、「推定子」および「統計」という重要な用語を型破りな方法で使用しているため、人々を誤解させたり混乱させたりする可能性があります。
whuber

仮説検定は、統計学の限られた専門分野であるとは考えられませんでした。
dfhgfh
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.