を最大化する点推定を使用する場合、それはあなたの哲学について何と言っていますか?(フリークエンシーまたはベイジアンまたは他の何か?)


12

誰かが言ったら

「この方法はを最大化するパラメーターのポイント推定MLEを使用するため、頻度が高く、さらにベイジアンではありません。」P(x|θ)

同意しますか?

  • 背景に関する最新情報:最近、頻繁に投稿されると主張する論文を読みました。私は彼らの主張に同意しない、せいぜい曖昧だと思う。この論文では、MLE(またはMAP)について明示的に言及していません。彼らは単にポイントの推定値を取得し、このポイントの推定値が真であるかのように単純に進みます。彼らはしますませんこの推定量のサンプリング分布、またはそのような何かの分析を行います。モデルは非常に複雑であるため、このような分析はおそらく不可能です。いずれの時点でも「後」という言葉は使用していません。彼らは、額面価格でこのポイント推定値を取得し、関心のある主要トピックである欠落データの推測に進みます。彼らの哲学には何があるかを示唆するアプローチは彼らのアプローチにはないと思います。彼らは頻繁になりたいと思っていたかもしれませんが(袖に哲学をつける義務があると感じているため)、実際のアプローチは非常に単純/便利/怠/で曖昧です。私は今、この研究にはその背後にある哲学は何もないと言う傾向があります。代わりに、彼らの態度はより実用的または便利だったと思う:

    「データを観測し、欠落データzを推定したい。zxの関係を制御するパラメーターθがあります。目的を達成するための手段を除き、θはあまり気にしません。私はのために見積もり持っθ、それはそれが簡単に予測することになりますZをからのxを、私はの点推定値を選択します。θを、それは便利ですので、特に私が選ぶだろう、θ最大PX | θを。」xzθzxθθzxθθ^P(x|θ)

不偏推定量 のアイデア明らかにFrequentist概念です。これは、データを条件とせず、パラメーターのすべての値を保持する素晴らしいプロパティ(不偏)を記述するためです。

ベイジアン手法では、データとパラメーターの役割は逆になります。特に、現在、観測されたデータを条件として、パラメーターの値について推論を進めています。これには事前の準備が必要です。

これまでのところこれでいいのですが、MLE(Maximum Likelihood Estimate)がこれに適合するのはどこですか?私は、多くの人がそれが周波数主義者である(またはより正確には、ベイジアンではない)と感じているという印象を受けます。しかし、観測データを取得し、を最大化するパラメーターを見つけることを含むため、ベイジアンであると感じています。MLEは暗黙的に均一な事前使用とデータの条件付けを使用し、P p a r a m e t eP(data|parameter)。MLEがフリークエンティストとベイジアンの両方に見えると言ってもいいですか?または、すべての単純なツールは、これら2つのカテゴリのいずれかに正確に該当する必要がありますか?P(parameter|data)

MLEは一貫していますていますが、一貫性はベイジアンのアイデアとして提示できると思います。任意の大きなサンプルが与えられると、推定値は正解に収束します。「推定値は真の値に等しい」というステートメントは、パラメーターのすべての値に当てはまります。興味深いのは、観測されたデータを条件にしてベイジアンにする場合にも、このステートメントが当てはまることです。この興味深いことは、MLEには当てはまりますが、公平な推定量には当てはまりません。

これが、MLEが周波数主義者として記述される可能性のあるメソッドの「最もベイジアン」であると感じる理由です。

とにかく、有限のサンプルサイズを含む、ほとんどのフリークエンティストの特性(不偏性など)はすべての場合に適用されます。一貫性が不可能なシナリオ(1つの実験内の無限のサンプル)でのみ成立するという事実は、一貫性がそのような有用な特性ではないことを示唆しています。

現実的な(つまり有限の)サンプルが与えられた場合、MLEに当てはまるFrequentistプロパティはありますか?そうでない場合、MLEは実際にはフリークエンティストではありません。


6
MLEは、両方のパラダイムのパラメーターの解釈から始まるベイジアンと見なすことはできません。ベイジアンの観点からは、パラメーターはランダム変数ですが、古典的な設定では推定される値です。MLEは多くの場合、MAP(および場合によっては他のポイントベイズ推定量)と一致しますが、解釈は完全に異なります。

3
@Procrastinator、コメントとして回答を投稿してください。私はそれをまだ支持したり受け入れたりするつもりはありませんが、あなたのコメントは答えだと感じています。その後、あなたと私はここでコメントを削除するかもしれません。
アーロンマク

1
私はこの質問を理解していません。(私はこれで一人かもしれません。)正確に何をあなたは「frequentist」によって意味ですか?「Not Bayesian」は、それができないでしょう。それは、広範な哲学と方法を含んでいるからです。何かを「頻度の高い財産」にするのはなぜですか?あなたの「フリークエンティスト」と、例えば、決定論的原理で統計的手順を正当化するアブラハム・ウォルドやジャック・キーファーとの間に何らかのつながりはありますか?(特にキーファーは、これに基づいてMLEについてかなり批判的な意見を持っていました。)
whuber

3
@whuber:あなたは一人ではありません。閉会の投票は私のもので、1、2日前に行われました。私の考えでは、この質問には、その説得力のあるややポレミックなフレーミングのために、建設的でないという明確さと焦点と境界線が欠けています。
枢機

1
モデレーターは多くの返信(受け入れられたものを含む!)やコメントを収集しているため、このスレッドを閉じることを渋っています。
whuber

回答:


7

または、すべての単純なツールは、これら2つのカテゴリのいずれかに正確に該当する必要がありますか?

いいえ。単純なツール(それほど単純なツールではありません)は、さまざまな視点から学習できます。尤度関数自体は、ベイジアン統計と頻出統計の両方の基礎であり、両方の観点から調べることができます!必要に応じて、MLEを近似ベイズソリューションとして学習するか、またはその特性を漸近理論で頻繁に調べることができます。


4
それは間違っているアーロン。頻度の高い人は最尤推定を使用し、尤度の原則を信じています。Kjetilは、尤度関数が推論に対するベイジアンおよび頻度論的アプローチの重要な要素であることは正しいです。しかし、彼らは異なる使い方をしています。
マイケルR.チャーニック

3
アーロンの質問には非常に良い答えを出しましたが、奇妙な理由で人々はそれを否定しています。彼らは何が起こっているのか理解してはなりません。尤度を最大化し、事前分布をまったく考慮しないため、最尤推定をベイジアンとして分類する方法はありません!
マイケルR.チャーニック

4
(私は自分のコメントを削除しました。役に立つコメントだけを追加するようにしています。)マイケル、下票について不満を言うことはありません。起こっている。」
アーロンマクデイド

7
@Michael、「なぜ私が投票したのか」から始まる生産的なやり取りを目撃したことはありますか?私は確かにそうではありません。そのため、私(およびここにいる他の数人のメンバー)は、会話が正当化されていると思うかどうかに関係なく、会話を開始することさえ思いとどまります。それは無意味であり、一般的にトピックを超えた議論の延長につながります。
マクロ

3
@Michael、私は説明をするのが一般的な礼儀であることに確かに同意します。そして、コメントで私の懸念を他の誰かがまだ表明していないならば、そうするようにします。しかし、もしあなたが静かな下票を受け取ったとしても、私は対象をブローチすることで生産的な会話が始まるとは思いません。
マクロ

10

あなたが最尤をやっているときの推定は、あなたが見積もりの値を考慮し、信頼区間として表現見積もりの不確実性を確立するために、推定器のサンプリングプロパティを。信頼区間は一般に観測されなかったサンプルポイントに依存するため、これはあなたの質問に関して重要だと思います。

PSこれは、最尤推定(ポイント+間隔)が尤度の原理を満たさないのに対し、完全な(「サベージスタイル」)ベイジアン解析が行うというより一般的な事実に関連しています。


+1。切り捨てられた法線が異なる後部をもたらすという考えは興味深く、驚くべきことです!私は懐疑的だったとコメントしましたが、そのコメントは削除しました。これについてもう少し考える必要があります。通常、尤度原理は「明らかに真実」だと思うので、これについてもう少し考えるべきです。
アーロンマクデイド

良い点禅。点の推定として、最尤推定は尤度の原則に準拠していますが、信頼区間の頻繁な概念はそうではありません。
マイケルR.チャーニック

@Zen、私は後継者が同じだとは確信していません。そのためのリファレンスはありますか?法線を切り捨てられた法線に置き換えると、事後が変更されるという引数を付け Googleドキュメントを作成しました。前もって感謝します。
アーロンマクデイド

6

尤度関数は、データと未知のパラメーターを含む関数です。パラメータの値が与えられると、観測データの確率密度として見ることができます。パラメーターは修正されました。したがって、可能性はそれ自体が頻繁な概念です。尤度を最大化することは、尤度が最大値を取るようにするパラメーターの特定の値を見つけることです。そのため、最尤推定は、データとそれを生成すると想定されるモデルの形式のみに基づいた頻度の高い手法です。ベイズ推定は、事前分布がパラメーターに配置され、ベイズの式を使用して事前分布と尤度を組み合わせてパラメーターの事後分布を取得する場合にのみ開始されます。


ここに投稿されたすべてのコメントは、専用のチャットルームに移動されました。誰かがこの部屋に参加するのが困難な場合、この場合のみ、モデレーターの注意を引くためにフラグを立ててください。これ以上のコメントは受け付けられません。
chl

6

「ベイジアン」とは、現在の経験的なベイズの意味ではなく、主観的なベイズ(別名、認識ベイズ、デフィネッティベイズ)を指していると仮定します。一方では、データのみに基づいて推測します。手元に主観的な信念はありません。これは十分な頻度であるように思えます...しかし、フィッシャー自身(厳密な非(主観的)ベイジアン)でも表現されている批判は、データのサンプリング分布の選択において主観性がcいだということです。データ生成プロセスの信念。

結論として、MLEは「頻度」と「ベイジアン」をどのように定義するかという問題だけではありますが、通常は頻度主義の概念と考えられています。


+1:これは私が上記のコメントで取得しようとしていたものです。
ニールG

1

(自分の質問に答える)

推定器は、いくつかのデータを取得し、番号(または番号の範囲)を生成する機能です。推定量自体は、実際には「ベイジアン」または「フリークエンシー」ではありません-数字が入り、数字が出るブラックボックスと考えることができます。同じ推定量を頻繁に使用する人とベイジアンに提示することができ、推定量について異なる意見を言うことができます。

(頻度主義者とベイジアンの単純な区別に満足していません。他にも考慮すべき問題があります。しかし、簡単にするために、明確に定義された2つの哲学的キャンプのふりをしましょう。)

研究者がどの推定量を選択するだけでベイジアンの頻度が高いかを知ることはできません。重要なことは、彼らが推定器で何を分析し、その推定器を選択した理由を聞くことです。

その価値を見つけるソフトウェアを作成するとします θ 最大化する Pバツ|θ。このソフトウェアを頻繁に提示し、それについてプレゼンテーションを行うよう依頼します。それらはおそらくサンプリング分布を分析し、推定値が偏っているかどうかをテストすることで進むでしょう。そして、おそらく彼らはそれが一貫しているかどうかをチェックします。このようなプロパティに基づいて、推定者を承認または不承認にします。これらは、頻繁に使用されるプロパティのタイプです。

同じソフトウェアがベイジアンに提示されると、ベイジアンはフリークエンティストの分析の多くに満足するでしょう。はい、他のすべてのものが同等であり、バイアスは良くなく、一貫性は良いです。しかし、ベイジアンは他のことにもっと興味を持つでしょう。ベイジアンは、推定量が事後分布の何らかの関数の形をとるかどうかを確認する必要があります。もしそうなら、どの事前分布が使用されましたか?推定量が事後分布に基づいている場合、ベイジアンは事前分布が良いものかどうか疑問に思います。事前に満足している場合、および推定者が事後のモードを報告している場合(たとえば、事後の平均とは対照的に)、彼らはこの解釈を推定に適用して喜んでいます:正しい可能性が最も高い推定値。」

頻繁に使用されるものとベイジアンは、関係する数字が同じであっても、物事を異なる方法で「解釈する」と言われます。これは少しわかりにくいかもしれませんが、本当のことだとは思いません。それらの解釈は互いに矛盾しません。彼らは単にシステムのさまざまな側面について声明を出します。その時点のポイント推定値を脇に置き、代わりに間隔を考慮しましょう。特に、頻繁な信頼区間とベイジアン信頼区間があります。彼らは通常異なる答えをします。ただし、特定の事前分布を使用した特定のモデルでは、2種類の間隔で同じ数値の答えが得られます。

間隔が同じ場合、どのようにそれらを異なって解釈できますか?頻度の高い人は、区間推定器について言います:

データまたは対応する間隔を見るに、真のパラメーターが間隔内に含まれる確率が少なくとも95%あると言えます。

一方、ベイジアンは区間推定量について言います:

データまたは対応する間隔を確認した、真のパラメーターが間隔内に含まれる確率が少なくとも95%あると言えます。

これらの2つのステートメントは、「前」と「後」という言葉を除いて同一です。ベイジアンは前者の声明を理解して同意し、その真理は以前のものとは無関係であることを認め、それにより「より強い」ものにします。しかし、私自身はベイジアンとして話すと、前の声明があまりよくないのではないかと心配になります役に立た。頻度主義者は後者の声明を好まないだろうが、頻度主義者の異議について公正な説明をするほど十分には理解していない。

データを見た後でも、フリークエンシー奏者は、真の値が間隔内に含まれていると楽観視していますか?そうでないかもしれない。これは少し直感に反しますが、信頼区間やサンプリング分布に基づくその他の概念を真に理解するために重要です。頻繁に言うと、「データが与えられれば、95%の確率で真の値がこの間隔にあると思う」と頻繁に言うでしょう。頻繁な人は、その声明が真実であるかどうかを疑うだけでなく、それが真実であるかどうかも疑う、この方法で確率を帰属さ意味あるします。これについてさらに質問がある場合は、私に尋ねないでください。この問題は私には多すぎます!

ベイジアンは、「今見たデータを条件として、真の値がこの範囲にある確率は95%です」と述べています。

最後の点で少し混乱していることを認めなければなりません。私は、データが見られるに頻繁行われた声明を理解し、それに同意します。データを見たにベイジアンが行った声明を理解し、同意します。ただし、データが表示された、フリークエンシー奏者が何と言うかはよくわかりません。世界に対する彼らの信念は変わりましたか?私はここで頻繁な哲学を理解する立場にありません。


1
私はこの明確で思考を提供するものの多くを見つけますが、根本的な何かを完全に無視するように見えます。また、最後の2つの段落は、私が見た分析や解釈には適用されません。確かに、私はあなたの「フリークエント主義者」(むしろ古代の哲学者のように聞こえる)の実践統計学者を認めません。誰が-少なくともアリストテレスの後-データが取得される前にデータ分析が完了したと言ったことはありますか?これはベイジアンアプローチを進めようとするストローマンですか?
whuber

1
@whuber、それがストローマンなら、それは意図的ではありません。他人の意見を誤って判断せずに報告しようとすることは常に困難です。そして、私は多くの微妙な立場について広く理解しているとは主張していません。最後の段落を再考してみます。また、「確率の異なる解釈」をすべて省いたと言います。間違ったことを言うよりも、何も言わない方がいいです。すべてを言うことは不可能です。私はあなたの真実とは何もなく、真実を与えることを試みることができますが、私はあなたに真実:-)与えることはできません
アーロンMcDaid

(+1)あなたは正しい、ここで長い議論があり、1つの投稿のすべてのポイントをカバーすることはできません。私はこの返事を慎重かつ思慮深い説明のために支持しています(しかし、私はすべてに同意するからではありません!)。
whuber

最後のいくつかの段落を編集して、より公平になるようにしました。「データを見た後...」以降。私は専門家ではないので、自分の深みから抜け出そうとしているところを正直に曖昧にしようとしています。フィードバックをお寄せいただきありがとうございます。
アーロンマクデイド

1

最大化するポイント推定器 Pバツ|θ is the MLE. This is a commonly used point estimator in frequentist statistics, but it is less commonly used in Bayesian statistics. In Bayesian statistics it is usual to use a point estimator which is either the posterior expected value, or the value minimising the expected-loss (risk) in a decision problem. There are certainly some cases where the Bayesian estimator will correspond with the MLE (e.g., if we have a uniform prior, or in some special cases of minimising loss), but this is not a common occurrence. Hence, as a general rule, the MLE is usually a frequentist estimator.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.