母集団の定量的特性は「パラメータ」ですか?


13

統計とパラメーターという用語の区別については比較的よく知っています。統計は、サンプルデータに関数を適用して得られた値として表示されます。ただし、パラメーターのほとんどの例は、パラメトリック分布の定義に関連しています。一般的な例は、正規分布をパラメーター化する平均と標準偏差、または線形回帰をパラメーター化する係数と誤差分散です。

ただし、人口分布のその他の多くの値はプロトタイプではありません(たとえば、最小、最大、重回帰のr平方、.25変位値、中央値、非ゼロ係数の予測子の数、歪度、数.3を超える相関行列の相関関係など)。

したがって、私の質問は次のとおりです。

  • 母集団の定量的特性に「パラメータ」というラベルを付ける必要がありますか?
  • はいの場合、なぜですか?
  • いいえの場合、パラメータにラベル付けしない特性は何ですか?それらは何にラベル付けされるべきですか?なぜ?

混乱に関する詳細

推定量に関するウィキペディアの記事には、次のように記載されています。

「推定器」または「点推定」は、統計モデルの未知のパラメーターの値を推測するために使用される統計(つまり、データの関数)です。

しかし、未知の値を.25分位として定義し、その未知の推定量を開発できます。つまり、母集団のすべての量的特性が、平均とsdが正規分布のパラメーターであると同じようにパラメーターであるわけではありませんが、量的母集団特性を推定しようとするのは正当です。

回答:


15

この質問は、統計とは何か、そして適切な統計分析を行う方法の中心になります。それは多くの問題を引き起こします。いくつかの用語と他の理論です。それらを明確にするために、質問の暗黙的なコンテキストに注目することから始めて、そこからキー用語「パラメーター」、「プロパティ」、および「推定器」を定義します。質問のいくつかの部分は、ディスカッションで出てきたときに答えられます。最後の最後のセクションでは、主要なアイデアを要約します。

状態空間

「分布に」の一般的な統計的使用。「expに比例するPD​​Fの正規分布1"明らかに、これは1つの配布ではないので、実際に英語の(深刻な)虐待である:それはディストリビューションの全体の家族はいパラメータ記号でμσの標準的な表記法。これは「状態空間」Ωセットexp(12(xμ)/σ)2)dxμσΩ分布の。(ここでは、説明のために少し簡略化していますが、できるだけ厳密なまま、簡単に説明を続けていきます。)その役割は、統計手順の可能なターゲットを線引きすることです。 1つ(またはそれ以上)の要素を選択します。Ω

時々状態空間を明示的に示すように、パラメータ化され。この説明では、上半平面のタプルのセット{ μ σ }と、データのモデル化に使用する分布のセットの間に1対1の対応があります。このようなパラメーター化の1つの値は、実数の順序付けられたペアを使用して、Ωの分布を具体的に参照できることです。Ω={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

その他の場合、状態空間は明示的にパラメーター化されません。例は、すべての単峰性連続分布のセットです。以下では、そのような場合に適切なパラメーター化が見つかるかどうかの問題に対処します。

パラメータ化

一般的に、パラメータ対応(数学ある機能のサブセットから)のR D(とDに有限の)Ω。つまり、順序付けられたdタプルのセットを使用して、分布にラベルを付けます。しかし、それは単なる通信ではありません。「行儀が良い」必要があります。これを理解するために、PDFの期待が有限であるすべての連続分布のセットを考慮してください。これは、このセットをパラメータ化しようとする「自然な」試みが、実数のカウント可能なシーケンスを含むという意味で「ノンパラメトリック」と広く見なされます(任意の直交基底で展開を使用)。それにもかかわらず、このセットは、基数を持っているのでΩRddΩd(実数のカーディナリティ)は、これらの分布と Rの間に1対1の対応が存在する必要があります。逆説的に、それはこれを単一の実パラメータを持つパラメータ化された状態空間にするように思えます!1R

パラドックスは、1つの実数が分布と「いい」関係を享受できないことに注意することで解決されます。その数の値を変更すると、対応する分布は場合によっては根本的に変化しなければなりません。パラメータの近い値に対応する分布が互いに「近い」必要があることを要求することにより、このような「病理学的」パラメータ化を排除します 「近い」という適切な定義を議論することは遠すぎますが、この説明で、特定の分布に名前を付けるだけでなく、パラメーターであることを示すことができることを願っています。

分布の特性

繰り返し適用することにより、分布の「特性」を、期待、分散など、作業に頻繁に現れるわかりやすい量として考えることに慣れてきます。「プロパティ」の可能な定義としてのこれに関する問題は、それがあまりにも曖昧であり、十分に一般的ではないということです。(これは数学が18世紀半ばにあった場所で、「機能」はオブジェクトに適用される有限プロセスと考えられていました。)代わりに、常に機能する「プロパティ」の唯一の賢明な定義は、プロパティをΩのすべての分布に一意に割り当てられる番号であることΩ。これには、平均、分散、任意の瞬間、任意のモーメントの代数的組み合わせ、任意の分位、さらには計算することさえできないものを含む多くが含まれます。ただし、Ωの一部の要素にとって意味をなさないもの含まれていませ。たとえば、Ωがすべてのスチューデントt分布で構成されている場合、平均はΩの有効なプロパティではありませんt 1には平均がないため)。これは、Ωが実際に何を構成しているかによって、アイデアがどれほど左右されるかを改めて印象づけます。ΩΩΩt1Ω

プロパティは常にパラメータではありません

プロパティは、パラメータとして機能しないような複雑な関数になる場合があります。「正規分布」の場合を考えます。真の分布の平均が最も近い整数に丸められたときに偶数かどうかを知りたい場合があります。それはプロパティです。ただし、パラメーターとしては機能しません。

パラメータは必ずしもプロパティではありません

パラメーターと分布が1対1に対応している場合、明らかに、すべてのパラメーターとその問題のパラメーターの機能は、定義によるとプロパティです。ただし、パラメーターと分布の間には1対1の対応が必要ではありません。パラメーターの2つ以上の明確に異なる値によって、いくつかの分布を記述する必要がある場合があります。たとえば、球体上のポイントの位置パラメーターは、当然緯度と経度を使用します。これは問題ありません。ただし、特定の緯度と有効な経度に対応する2つの極を除きます。場所(球上の点)は確かにプロパティですが、その経度は必ずしもプロパティではありません。さまざまな回避策がありますが(たとえば、極の経度をゼロと宣言するだけです)、この問題はプロパティ(分布に一意に関連付けられている)とパラメーター(ラベル付けの方法)の間の重要な概念上の違いを強調しています分布と一意でない場合があります)。

統計的手順

見積もりのターゲットが呼び出されestimand。単なるプロパティです。統計学者は見積もりを自由に選択できません。それは彼女のクライアントの州です。誰かが母集団のサンプルを持ってあなたのところに来て、母集団の99パーセンタイルを推定するように頼むとき、代わりに平均の推定量を提供することを怠るでしょう!統計学者としてのあなたの仕事は、与えられた推定量を推定するための良い手順を特定することです。(あなたの仕事は、クライアントが科学的目的のために間違った見積もりを選択したことをクライアントに説得することですが、それは別の問題です...)

定義により、プロシージャはデータから数値を取得する方法です。通常、手順は、「それらをすべて加算し、カウントで除算する」など、データに適用される式として与えられます。文字通り、任意の手順は、特定の推定量の「推定子」と発音できます。たとえば、サンプル平均(データに適用される式)が母集団の分散(クライアントが実際に分散を持つ母集団の集合Ωを制限していると仮定した母集団の特性)を推定することを宣言できます。Ω

推定量

推定量は、推定量と明確に関係する必要はありません。たとえば、標本の平均と母集団の分散との間に関連性がありますか?私もそうではありません。それにもかかわらず、サンプル平均は、実際には特定のΩ(すべてのポアソン分布のセットなど)の母分散の適切な推定量です。ここに、推定量を理解するための1つの鍵があります。それらの品質は、可能な状態セットに依存します。しかし、それはその一部にすぎません。Ω

有能な統計学者は、彼らが推奨している手順が実際にどれだけうまくいくかを知りたいと思うでしょう。手順「」を呼び出して、推定値をθとします。実際には真の一つである分布を知ることではない、彼女は手続きのパフォーマンスを考えるだろう、すべての可能な分配のためのF Ω。こうした考えるとF、および任意の可能な結果与えられたS(データのある、セット)を、彼女が比較されますトン複数可に(どのような彼女の手続き推定値)をθ F (用estimandの値F)。 tθ FΩFst(s)θ(F)Fこれらの2つがどれだけ近いかまたは離れているかを彼女に伝えることは、彼女のクライアントの責任です。 (これは、多くの場合、「損失」関数を使用して行われます。)彼女は、t s θ F 間の距離の予想を熟考できます。これが彼女の処置のリスクです。Fに依存するため、リスクはΩで定義される関数です。t(s)θ(F)FΩ

(良い)統計学者は、リスクの比較に基づいて手順を推奨します。例えば、すべてのために仮定する、プロシージャのリスクT 1未満、またはリスクに等しいT。それからtを使用する理由はありません。それは「許されません」。それ以外の場合は「許容」されます。FΩt1tt

(「ベイジアン」統計学者は、可能性のある状態(通常はクライアントによって提供される)の「事前」分布を平均化することにより、常にリスクを比較します。「フリークエンシー」統計学者は、ベイジアンが回避する他の方法でリスクを比較します。)

結論

私たちはどんなことを言う権利持っのために許容されるθがある推定θをtθθ 我々は、(許容手続きを見つけるのは難しいことができますので)実用的な目的のために、と言ってこれを曲げる必要があります任意の許容できる小さなリスク(と比較されるときがあるθ実用的な手続きの中では)の推定量ですθtθθ もちろん、「許容可能」および「実行可能」はクライアントによって決定されます。「許容可能」はリスクを指し、「実行可能」は手順の実装コスト(最終的に支払われる)を表します。

この簡潔な定義の基礎となると、すべてのアイデアがちょうど議論されています。私たちはそれを理解する必要があります念頭に置いて、特定の持って(あるモデル、(クライアントによって供給されている)、明確なestimand調査中の問題、プロセス、または人口の)、特定の損失関数(tを推定値に定量的に接続し、クライアントによっても与えられる)、リスクの概念(統計学者によって計算)、リスク関数を比較するための手順(クライアントと協議した統計学者の責任)、また、定義でこれらのいずれも明示的に言及されていない場合でも、実際に実行できる手順の感覚(「実行可能性」問題)。Ωt


2
@Nick Coxは、彼の回答で、(私の解釈では)「モデルおよび指定した損失関数が多少不正確または不適切であることがわかった場合、どうすればよいか」という点で優れた点を挙げています。それに対する答えは、私たちを別の方向に連れて行くでしょう。ここで言いたいことは、私が述べたフレームワーク(Tukeyが反応していた古典的なフレームワーク)が、このようなより広範なデータ分析の問題について考えるための良い基盤を与えてくれることです。少なくとも、「推定器」のような標準的な用語に入る暗黙の仮定を明確にします。Ω
whuber

11

定義に関する多くの質問と同様に、答えは基本的な原則と用語が実際に使用される方法の両方に目を向ける必要があります。重要なのは、コミュニティごとに異なることです。

一般的な原則の1つは、統計がサンプルのプロパティであり、既知の定数であり、パラメーターが母集団の対応するプロパティであるため、未知の定数であることです。「対応する」という言葉は、ここでは非常に弾力性があると理解されるべきです。ちなみに、この区別と正確にこの用語は、RA Fisherによって導入されてから1世紀も経たないものです。

だが

  1. サンプルと母集団の設定は、私たち自身の問題すべてを特徴付けるものではありません。時系列は、アイデアがむしろ根底にある生成プロセスである例の1つの主要なクラスであり、そのようなものは、おそらくより深くより一般的なアイデアです。

  2. パラメーターを変更するセットアップがあります。繰り返しますが、時系列分析は例を提供します。

  3. ここでの主要なポイントまで、実際には母集団またはプロセスのすべてのプロパティをパラメーターとして考えているわけではありません。一部の手順が正規分布のモデルを想定している場合、最小値と最大値はパラメーターではありません。(実際、モデルによると、最小値と最大値は任意の大きな負数と正数であり、心配する必要はありません。)

ここでウィキペディアが正しい方向を指しているのは一度だけであり、パラメーターが推定するものあると言えば、実践と原則の両方が尊重されます

これは、困惑を引き起こした他の質問にも役立ちます。たとえば、25%トリム平均を計算する場合、何を推定しますか?合理的な答えは、母集団の対応する特性であり、実際には推定方法によって定義されます。1つの用語は、推定するものが何であれ、推定器には推定対象があるということです。「外にある」プロパティ(分布のモードなど)のプラトニックなアイデアから始めて、データを分析し、推論と見なされたときにそれらが意味するものを考えるための優れたレシピを考えているように、それを合理的に推定する方法を考えます。

応用数学や科学でよくあることですが、パラメータには2つの側面があります。私たちはしばしばそれを私たちが発見している現実のものと考えますが、それはプロセスのモデルによって定義されたものであり、モデルのコンテキスト外では意味を持たないことも事実です。

2つのまったく異なる点:

  1. 多くの科学者は、統計学者が変数を使用する方法で「パラメーター」という言葉を使用します。科学者のペルソナと統計的なペルソナがありますが、それは残念です。変数とプロパティは良い言葉です。

  2. より広い英語の使用法では、パラメータは限界または境界を意味すると考えられていることが非常に一般的です。

見積もりの​​観点に関する注記

古典的な立場は、パラメータを事前に特定し、それをどのように推定するかを決定することです。これは多数派の慣行のままですが、プロセスを逆にすることは不合理ではなく、いくつかの問題に役立ちます。これを推定の観点と呼びます。それは少なくとも50年にわたって文献に記載されています。Tukey(1962、p.60)は

「推定器から始めて、合理的な推定値を発見し、推定器を推定と考えることが合理的なものを発見することにさらに注意を払わなければなりません。」

同様の観点は、Bickel and Lehmann(1975)によりかなり詳細かつ詳細に、Moseller and Tukey(1977、pp.32-34)により非公式にかなり詳細に詳述されています。

基本バージョンもあります。(たとえば)サンプルの中央値または幾何平均を使用して、対応する母集団パラメーターを推定することは、基礎となる分布が対称であるかどうかに関係なく意味があり、同じ善意を(たとえば)標本対応平均値に拡張できます。 。

Bickel、PJ、およびEL Lehmann。1975. ノンパラメトリックモデルの記述統計。II。場所統計の年表 3:1045-1069。

Mosteller、F。およびJW Tukey。1977. データ分析と回帰。 レディング、MA:アディソン・ウェスリー。

Tukey、JW1962。データ分析の未来数理統計学 33:1-67。


これの多くは、標準統計文献、特にパラメータの定義との対立に注目しています。推定値を計算するための手順を見つけて、推定対象特定するプロセスを混乱させるようです。後者-推定量の選択-は、科学者または研究者が決定する問題です。前者は、推定量を推定するためのすべての可能な手順の中で望ましい特性を持つように、統計学者によって選択されます。技術的な問題もあります。パラメータは任意の推定量よりも制限されていると言えば十分です。
whuber

これに対処するために回答を拡大します。
ニックコックス

1
このスレッドに対する私の答えから、私は彼が挑戦する「骨化した」統計学者の一人だと思うかもしれませんが、私はテューキーに同意します。問題は、彼の引用が文脈から外れていることです。テューキーは、「慣習的に開発された仮説が成り立たないとき」、手順の特性を評価する方法の問題に特に取り組んでいます。これにより、パラメーター、推定量、推定量などの定義が変更されることはありません。特に、パラメーターは「推定するもの」ではありません
whuber

3
ここで考えるべき多くの食べ物。簡単な返事として:私の答えは、私たちが何でもあるリバティーホールにいることを暗示することを意図していませんでした。私の見解では、すべてのモデルがデータと正確に一致しない近似である限り、慣習的な仮説が成り立たないのが普通なので、Tukey引用のコンテキストは歓迎します。これまでのところ、その節は異なる視点の価値を強調しています。一般的に、私はより抽象的な、より数学的に洗練された形式的な定義を試みることも、作成する資格もありません。
ニックコックス

6

私は、正規分布を考えることで類推によってパラメーターを考える傾向があります
何この機能について認識することが重要なのは、部品のほとんどが何であるか、私はかなり知られている醜いなどとして、ということです。例えば、私は、数字か分から1及び2があり、どのようなπがある(3.1415926)とどのEは(ある2.718281828)。私は何かを二乗すること、または何かの平方根を取ることの意味を知っています-私は基本的にそれをすべて知っています。また、私はいくつかの特定の機能の高さを知りたいと思った場合、Xの値を、xは私を、私は明らかに知っていること

pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxi値も。言い換えれば、私は上記の式は、私は、知っておくべきものはすべて知っている、と仕事ができるために必要なものであることを知っていれば私は値を学習したら、σ 2をμσ2。それらの値はパラメータです。具体的には、分布の動作を制御する未知の定数です。このように、私が知りたかった場合例えば、に対応した値が25 番目の%を、私はそれを決定することができます(またはその分布についての何か)、後に知っμ及びσ 2(ただし、他の方法で回避します)。上記の方程式はμX25th%μσ2μそして、、それが他の値のためにないような方法で。 σ2

同様に、Iは、データ生成プロセスがあることが想定されるOLS重回帰モデルを用いて作業していた場合:

Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0β1β2σ2β0β1β2σ2

(もちろん、これはすべて、人口分布またはデータ生成プロセスの私のモデルが正しいことを前提としています。いつものように、「すべてのモデルは間違っていますが、一部は有用です」- ジョージボックスです。)

より明確にあなたの質問に答えるために、私は言うでしょう:

  • いいえ、古い量的要素を適切に「パラメータ」とラベル付けしないでください。
  • 該当なし
  • 「パラメータ」とラベル付けする必要がある特性は、モデルの仕様によって異なります。他の定量的特性に特別な名前はありませんが、それらをプロパティ特性、または結果などと呼ぶのはいいと思います。

ありがとう。しかし、パラメトリックモデルから導出できるが、そのモデルを表現するための便利なパラメーターセットに含まれていないすべての人口値を記述するために、どの用語を使用しますか?または、人口モデルを知らず、特に気にしないが、人口モデルの特定の非標準的な側面に関心がある場合があります。
ジェロミーアングリム

一般的に適用可能な特別な名前はありませんが、特定の値には名前があります。例えば、あなたが本当にあなたの人口が十分に近い任意のよく研究されたディストリビューションにあることを信じていない場合、あなたはなど、その中央値、四分位、ヒンジ点で、それを特徴づけるしようとする可能性があり
GUNG -復活モニカ

3
β0,β1,β2,σθβ0θθθ
whuber

3

この質問にはいくつかの素晴らしい答えがありました。見積もり者についてかなり厳密な議論を提供する興味深い参考文献を要約すると思いました。

推定量の仮想研究所のページで は、

  • 「結果変数の観測可能な関数」としての統計
  • θ

分布の関数の概念は非常に一般的な考え方です。したがって、上記のすべての例は、特定の分布の関数として見ることができます。

  • 最小値、中央値、25番目の変位値を含むすべての変位値は、分布の関数になります。
  • 歪度は分布の関数です。その人口分布が正常な場合、これらはゼロになりますが、これらの値の計算は停止しません。
  • 特定の値よりも大きい相関の数を数えることは、共分散行列の関数であり、共分散行列は多変量分布の関数です。
  • R二乗は分布の関数です。

1
より詳細な答えを提供した理由の1つは、この「パラメーター」の定義では十分ではないということです。1つの反例については、@ gungの回答に対する私のコメントを参照しください。直感的には、パラメーター化された分布のセットは、境界のある有限次元の位相多様体を形成します。パラメーターは、多様体で定義された連続関数でなければなりません。これは、推定値のサンプリング分布に関連するため、単なる技術的な要件ではありません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.