最尤推定を使用することはありますか?


14

統計で最尤推定が使用されているかどうか疑問に思っています。私たちはその概念を学びますが、実際にいつ使用されるのでしょうか。データの分布を仮定すると、2つのパラメーターが見つかります。1つは平均用で、もう1つは分散用ですが、実際の状況で実際に使用しますか?

誰かがそれが使用されている簡単なケースを教えてもらえますか?


33
それは最も一般的な推定法。その
-JohnK

3
私たちはMLE使用していないとき尋ねるしようとしていた
ハイタオ・ドゥ

4
ロジスティック回帰。ポアソン回帰。エラーが正常であると想定される場合、OLSはMLEです。ガンマ回帰。古典的なGLMは本当に。正常な母集団からの平均の推定。一連の二項試行からの成功確率の推定。ポアソンイベントレートの推定。
続ける

4
このサイトの非常に狭い検索では、実際の使用例が何百も生成されます。
whuber

6
@ hxd1011あなたはされていない、あなたが使用している推定器はMLE推定と一致して起こるかもしれない場合でも、例えば、見積りのか計算確信、予測、または許容範囲間隔にばらつきを得るために、そのメソッドを使用していないときMLEを使用しました。たとえば、t検定を実行するときにMLEを使用していません。偏りのない推定量を適用するときには、多くの場合それを使用しません。哲学的には、損失関数に関心がある場合、または事前分布がある場合はMLEを使用しません。
whuber

回答:


25

統計で最尤推定が使用されているかどうか疑問に思っています。

もちろん!実際にはかなり多くの-しかし、常にではありません。

私たちはその概念を学びますが、実際にいつ使用されるのでしょうか。

人々がパラメトリックな分布モデルを持っているとき、彼らは非常に頻繁に最尤推定を使用することを選択します。モデルが正しい場合、最尤推定量の便利なプロパティがいくつかあります。

一例として、一般化線形モデルの使用は非常に広く普及しており、その場合、平均を記述するパラメーターは最尤法によって推定されます。

一部のパラメーターは最尤法で推定され、その他のパラメーターは推定されない場合があります。たとえば、過分散ポアソンGLMを考えてみましょう-分散パラメーターは最尤法では推定されません。その場合、MLEは役に立たないためです。

データの分布を仮定すると、2つのパラメーターが見つかります

さて、2つある場合もあれば、1つ、場合によっては3つまたは4つ以上のパラメーターがある場合もあります。

1つは平均値、もう1つは分散値、

おそらく特定のモデルを考えていますか?これは常にそうではありません。指数分布、ポアソン分布、または二項分布のパラメーターを推定することを検討してください。これらの各ケースでは、1つのパラメーターがあり、分散は平均を表すパラメーターの関数です。

または、3つのパラメーターを持つ一般化されたガンマ分布を考えます。または、4つのパラメーターのベータ分布(これは(おそらく驚くことではないが)4つのパラメーターを持っています)。また、(特定のパラメーター化に応じて)平均または分散、あるいはその両方は、単一のパラメーターではなく、それらのいくつかの関数によって表される場合があることに注意してください。

たとえば、ガンマ分布には、かなり一般的に使用される3つのパラメーター化があります。最も一般的な 2つは、2つのパラメーターの関数である平均と分散の両方を持っています。

通常、回帰モデル、GLM、または生存モデル(他の多くのモデルタイプの中で)では、モデルは複数の予測子に依存する場合があります。その場合、モデルの各観測に関連付けられた分布は独自のパラメーターの1つを持つ場合があります(または多くの予測変数(「独立変数」)に関連する複数のパラメーター)。


5
「人々がパラメトリックな分布モデルを持っているとき。」経験的尤度を含めるために、ノンパラメトリック最尤推定を忘れないでください。
マークL.ストーン

3
ただし、@ Markは比較的まれです。答えに言葉を追加します。
Glen_b-モニカを

たとえば、分布が正規であると仮定しても、最尤推定を使用できますか?必要はないと思いますが、それでも使用できます。
user122358

@ user122358グレンとマークはすでに答えました。ディストリビューションを想定することも、想定しないこともできます。ほとんどの場合、分布、したがって尤度関数を仮定します。
HelloWorld

3
「人々がパラメトリックな分布モデルを持っているとき。」部分尤度を含めるために、セミパラメトリック最尤推定を忘れないでください。;)
Scortchi-モニカの復職

8

データ分布に関する仮定を考慮すると、最尤推定量は疑わしいように見えますが、準最尤推定量がよく使用されます。考え方は、分布を仮定してMLEを解くことから始めてから、明示的な分布の仮定を削除し、代わりに推定器がより一般的な条件下でどのように機能するかを調べることです。そのため、準MLEは推定器を取得するスマートな方法になり、作業の大部分は推定器のプロパティを導き出します。分布の仮定が破棄されるため、通常、準MLEには効率の良い特性はありません。

おもちゃの例として、あなたはIIDサンプルを持っていると、およびXの分散の推定量が必要です。あなたは想定して始めることができるX N μ σ 2、通常のPDFファイルを使用して可能性を書き、そして解決ARGMAXのために取得するにはσ 2 = N - 1 Σ X I - ˉ X2。その後、どのような条件の下でのような質問をすることができますx1,x2,...,xnXXN(μ,σ2)σ^2=n1(xix¯)2一貫した推定、それは(それがない)、公正であり、それは等、それのasypmtotic分布が何であるか、ルートnは一致していますσ^2


また、Quasi MLEの背後にある直感でこのスレッドを確認できます。
リチャードハーディ

5

最尤推定は多くの場合、機械学習でトレーニングに使用されます。

場合によっては、いくつかの正則化を追加することを好むことに注意してください。これは、事後推定の最大値に相当する場合があります。たとえば、なぜLassoペナルティは二重指数(ラプラス)事前に等しいのですか?


3

誰かがそれが使用されている簡単なケースを教えてもらえますか?

非常に典型的なケースは、ロジスティック回帰です。ロジスティック回帰は、データポイントを分類するために機械学習でよく使用される手法です。たとえば、ロジスティック回帰を使用して、電子メールがスパムかスパムでないかを分類したり、人が病気にかかっているかどうかを分類したりできます。

xihθ(xi)=P[yi=1]=11+eθTxi

θ

θ^i=1nyilog(hθ^(xi))+(1yi)log(1hθ^(xi))


1

私たちは常にMLEを使用していますが、感じないかもしれません。2つの簡単な例を示します。

例1

810θθ=0.8

カウントを使用する理由 これは実際には暗黙的にMLEを使用しています!問題があるところ

Maximizeθ   θ8(1θ)2

方程式を解くには、計算が必要ですが、結論は重要です。

例2

データからガウス分布パラメーターをどのように推定しますか?推定平均として経験的平均を使用し、推定分散として経験的分散を使用します。これもMLE!に由来します。


6
例1は、ベイズソリューションとモーメント法(MM)ソリューションでもあります(おそらく、他の手順を使用したソリューションでもあります)。例2はMMソリューションです。MLE のみの手順を提示する方がはるかに説得力があります。そうでなければ、MLE は必要ありません。
whuber

例1がBayesソリューションになり、例2がMMソリューションになるのはなぜですか?ところで、MMとは何ですか?
user122358

@ user122358 MMはモーメントの方法です。たとえば、こちらをご覧ください:en.wikipedia.org/wiki/Method_of_moments_
statistics

0

ワイヤレス通信でのいくつかの最尤法の使用:

  • 冗長コードの有無にかかわらず、ノイズの多い受信信号からのデジタルデータのデコード。
  • 受信機の時間、位相、および周波数オフセットの推定。
  • 伝搬チャネル(のパラメーター)の推定。
  • 遅延、到着角、ドップラーシフト(レーダーなど)の推定。
  • モバイル位置の推定(GPSなど)。
  • あらゆる種類の分散設定の同期のためのクロックオフセットの推定。
  • 多数のキャリブレーション手順。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.