推定量と推定量の関係は何ですか?


21

推定量と推定量の関係は何ですか?


5
「統計では、推定量は観測データに基づいて所定の量の推定値を計算するための規則です。したがって、規則とその結果(推定値)は区別されます。」(ウィキペディアの記事en.wikipedia.org/wiki/Estimatorの最初の行)。
whuber

+1この質問に答える最初の試みはいくつかの微妙な点を指摘しているので、私はこの質問に賛成しています(明らかなウィキペディアのページに明確に定式化された答えが存在するにもかかわらず)。
whuber

@whuber、モデルパラメーターの推定値が推定量であると言えますか?
アボカド

2
@loganecolss推定量は数学関数です。これは、データのセットに対して得られる可能性のある値(推定値)とは区別されます。違いを理解する1つの方法は、特定のデータセットが、たとえば、異なる推定量(たとえば、最尤法または反復再重み付け最小二乗法など)を使用して線形回帰の勾配の同じ推定値を生成することに注意することです。推定値とそれらの推定値を生成するために使用された推定値を区別しないと、その声明が何を言っているのか理解できません。
whuber

@whuberは、1つの特定のデータセットであっても、異なる推定器が異なる推定値を与える可能性があります。D
アボカド

回答:


13

EL Lehmannは、古典的なポイント推定の理論で、この質問にpp 1-2で答えています。

観測値は、既知のクラスに属する結合確率分布に従うと仮定される確率変数によって取得される値であると仮定されています...P

...ポイント推定に特化しましょう...が[規定された分布のクラスで]定義された実数値関数であり、[実際の分布が何であれ]での値を知りたいとします効果、 ]。残念ながら、、したがっては不明です。しかし、データは、推定得るために使用することができる 1人の希望が近くになることを、値。ggθθg(θ)g(θ)g(θ)

言い換えると、推定量は、特定の問題が発生する可能性のあるデータのセットの数(推定値)を算出する明確な数学的手順です。その数値は、データ生成プロセスのいくつかの明確な数値特性()を表すことを目的としています。これを「推定」と呼ぶ場合があります。g(θ)

推定器自体はランダム変数ではなく、単なる数学関数です。ただし、生成される推定値は、ランダム変数としてモデル化されるデータに基づいています。これは作る推定確率変数とに(データに依存するものと考えられる)、特定の推定のためのデータの特定のセットその確率変数の実現になります。

1つの(従来の)通常の最小二乗定式化では、データは順序付けられたペアます。(彼らは例えば、投与された薬物の量もできる)、実験者によって決定されています。各(たとえば、薬物への応答)は、正規であるが未知の平均および共通分散ある確率分布に由来すると想定されます。さらに、平均は式介して関連していると想定されます。これら3つのパラメーター-、、および(xi,yi)xiyiμiσ2xiμi=β0+β1xiσβ0β1基礎となる分布--determineの任意の値の。したがって、任意のその分布の特性はの関数と考えることができる。このようなプロパティの例は、切片、勾配、の値、または値平均です(この定式化による) )なければなりません。yixi(σ,β0,β1)β0β1cos(σ+β02β1)x=2β0+2β1

このOLSの文脈において、非例推定のは、の値を推測する手順であろう場合は 2に等しくなるように設定されたこれはないのは、この値ので、推定量あるランダム(ように完全とは別にデータのランダム性):分布に関連していても、分布の(明確な数値)プロパティではありません。(ただし、先ほど見たように、に対するの期待値yxyyx=2に等しい、推定することができます。)β0+2β1

レーマンの定式化では、ほぼすべての式がほぼすべての特性の推定量になります。 推定量と推定量の間に固有の数学的リンクはありません。 ただし、推定者が推定する量に合理的に近い可能性を事前に評価できます。これを行う方法、およびそれらを活用する方法は、推定理論の主題です。


1
(+1)非常に正確で詳細な応答。
-chl

2
ランダム変数の関数自体もランダム変数ではありませんか?
jsk

@jskここで私がしようとしていた区別は、関数構成を考慮することによって明確にされると思います最初の関数はランダム変数Xです。もう一つは(それを呼び出すトン)と呼ばれる推定ここでは、との構図2つのトンX Ω Rがあり、「見積もり」または「推定手順、」です-あなたは正しく言うように-ランダム変数。
ΩRnR.
Xt
tX:ΩR
whuber

1
@whuberあなたの投稿では、「推定量自体はランダム変数ではありません」と言います。あなたと私が同意しているように見える点を明確にするためにあなたの投稿を編集しようとしましたが、誰かが私の編集を拒否したようです。おそらく彼らはあなたの編集を好むでしょう!
jsk


7

要するに、推定量は関数であり、推定量は観測されたサンプルを要約する値です。

推定は、パラメータ推定値にランダムなサンプルをマップする関数です。

Θ^=t(X1,X2,...,Xn)
X1,X2,...,XnΘ^
X¯=1nn=1nXi
θ^x1,x2,...,xn

θ^=t(x1,x2,...,xn)
x1,x2,...,xn
μ^=x¯=1nn=1nxi

推定値はRVですが、推定値は定数ですか?
パルティバンラジェンドラン

あなたの結論は@whuberと矛盾していませんか?ここでは、推定量はRVと言いますが、whuberはそうではないと言います。
パルティバンラジェンドラン

はい、@ whuberの「推定子自体はランダム変数ではありません。単なる数学関数です」とは言いません。ランダム変数の関数もランダム変数です。onlinecourses.science.psu.edu/stat414/node/128
フリーマン

3

線形回帰モデルのコンテキストでwhuberの答えを説明すると役立つ場合があります。2変量データがあり、通常最小二乗法を使用して次のモデルを作成するとします。

Y = 6X + 1

この時点で、Xの任意の値を取得してモデルに接続し、結果Yを予測できます。この意味で、モデルの一般的な形式(mX + B)の個々のコンポーネントを推定量と考えることができます。サンプルデータ(汎用モデルにプラグインして、上記のmおよびBの特定の値を計算すると思われる)は、それぞれmおよびBの推定値導き出すための基礎となりました。

以下のスレッドの@whuberのポイントと一致して、特定の推定量のセットが生成するYの値は、線形回帰のコンテキストでは予測値と見なされます。

(編集-数回-以下のコメントを反映するため)


1
予測子を適切に定義しました それは推定器とは微妙に(しかし重要なことですが)異なります。このコンテキストの推定量は、データからパラメーター1および6を計算するために使用される最小二乗公式です。
whuber

うーん、そういうわけではありませんでした、@ whuber、しかし、あなたのコメントは、私が以前は気付かなかった私の言語の重要な曖昧さを示していると思います。ここでの主なポイントは、式Y = mX + B(上記で使用)の一般的な形式を推定器として考えることができるのに対し、その式の特定の例(1 + 6Xなど)によって生成される特定の予測値は見積り。上記の段落を編集して、その違いを把握してみましょう
...-

ところで、私はこの概念のほとんどの教科書の議論で出会った「帽子」表記法を導入せずにこれを説明しようとしています。おそらくそれがより良いルートでしょうか?
-ashaw

2
あなたはあなたの元の答えで精度と技術の間の良い媒体を見つけたと思います:それを維持してください!帽子は必要ありませんが、推定者が他の似たようなものとどのように区別されるかを示すことができれば、それは最も役立ちます。ただし、値Yの予測mbなどのパラメーターの推定の違いに注意してください。Yは確率変数として解釈できます。mとbはそうではありません(ベイジアン設定を除く)。
whuber

実際、パラメータと値の点で非常に良い点です。もう一度編集しています
...-ashaw

0

データを受け取り、シータと呼ばれる観測された変数があったとします。データの分布からデータを取得できるようになりました。この分布には、ランダム変数であると推測されるthetaの対応する値があります。データの分布が変わるたびに、このランダム変数の推定値を計算するためにMAPまたは平均を使用できます。そのため、ランダム変数シータは推定値として知られており、特定の種類のデータの観測されていない変数の単一の値です。

推定量はあなたのデータですが、これもランダム変数です。分布のタイプが異なると、データのタイプも異なるため、推定値も異なるため、この対応するランダム変数は推定器と呼ばれます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.