三角分布のMLE?


12

通常のMLE手順を三角形の分布に適用することは可能ですか?-私は試していますが、分布が定義されている方法によって、数学のいずれかのステップでブロックされているようです。私は、cの上下のサンプル数を知っている(cを知らなくても)という事実を使用しようとしています。nがサンプルの総数である場合、これらの2つの数はcnと(1-c)nです。しかし、それは導出には役立たないようです。瞬間のモーメントは、cの推定量をほとんど問題なく与えます。ここでMLEに対する閉塞の正確な性質は何ですか(実際にある場合)?

詳細:

さんが考える[ 0 1 ]と上に定義されたディストリビューション[ 0 1 ]によって: c[0,1][0,1]

X <Cの場合、FXC=21-Xf(x;c)=2xc
c <= xの場合 f(x;c)=2(1x)(1c)

このサンプルから与えられたcの対数尤度からこの分布から iidサンプル{ x i }を取りましょう:n{xi}

l^(c|{xi})=i=1nln(f(xi|c))

私は、その後の形与えられたという事実を使用しようとしています、我々はそれを知っているCをn個のサンプルは、(不明)を下回るだろうC、および1 - C のnの上に落ちる、C。私見、これはこうして対数尤度の表現の総和を分解することを可能にします:fcnc(1c)nc

l^(c|{xi})=i=1cnln2xic+i=1(1c)nln2(1xi)1c

cc

l^(c|{xi})=i=1n{xi<c}ln2xic+i=1n{c<=xi}ln2(1xi)1c

しかし、指標の導出も簡単ではないように思われますが、ディラックのデルタは継続可能です(製品を導出する必要があるため、指標がまだある間)。

だから、ここで私はMLEでブロックされています。何か案が?


これが一部の主題に関するものである場合は、自習タグを追加してください。そうでない場合は、問題の発生方法を説明してください。
Glen_b-2013

更新していただきありがとうございます; 対処するケースの範囲が大幅に減少するため、賢明なことを答えることがはるかに簡単になります。以前のコメントをご検討ください。これは自習タグに該当するか、該当しないかのどちらかです。どちらの場合も、何かするかどうか尋ねました。
Glen_b-モニカを2013

これは宿題やクラスのためではありません。それは私の仕事で発生します。瞬間の方法から別の推定量がありますが、ここではMLEで何が起こっているのかをより深く理解しようとしています。
フランク

はい; それは私にもっと余裕を与えます。私の更新された答えを見てください。私はおそらくすぐにさらに追加するでしょう
Glen_b -Reinstate Monica

追加された参照/リンク
Glen_b-モニカを復活させる'07

回答:


10

通常のMLE手順を三角形の分布に適用することは可能ですか?

もちろん!処理する奇妙な点がいくつかありますが、この場合、MLEを計算することは可能です。

ただし、「通常の手順」で「対数尤度の導関数を取り、それをゼロに設定する」ことを意味する場合は、おそらくそうではありません。

ここでMLEに対する閉塞の正確な性質は何ですか(実際にある場合)?

可能性を描いてみましたか?

-

質問を明確にした後のフォローアップ:

可能性を引き出すことについての質問は、怠惰な解説ではなく、問題の中心でした。

MLEはデリバティブを取ることを含みます

いいえ。MLEは関数のargmaxを見つけることを含みます。これは、特定の条件下で導関数のゼロを見つけることのみを含みます...これはここでは成立しません。せいぜい、そうすることができれば、いくつかの極小値を特定できます。

私の以前の質問が示唆したように、可能性を見てください

y

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

c三角形のピークの可能性

三角形のピークの対数尤度

灰色の線はデータ値を示しています(値をより適切に分離するために、おそらく新しいサンプルを生成しているはずです)。黒い点は、これらの値の可能性/対数尤度を示します。

詳細を確認するために、可能性の最大値に近いズームインを示します。

可能性の詳細

尤度からわかるように、次数統計の多くでは、尤度関数に鋭い「コーナー」があります。これは導関数が存在しないポイントです(これは驚くべきことではありません。元のpdfにコーナーがあり、 PDFの製品)。これは(次数統計に尖点がある)三角分布の場合であり、最大値は常に次数統計の1つで発生します。(その尖点は、次数統計で発生します。これは、三角形の分布に固有のものではありません。たとえば、ラプラス密度にはコーナーがあり、その結果、その中心の可能性は各次数統計で1つになります。)

私のサンプルで発生するように、最大​​値は4次の統計として発生します。0.3780912

cc

参考になるのは、ヨハンファンドープとサミュエルコッツによる「Beyond Beta」の第1章です。偶然にも、第1章は本の無料の「サンプル」章ですここからダウンロードできます。

三角分布のこの問題についてのエディ・オリバーによる素敵な小さな論文があります、私はアメリカの統計学者(それは基本的に同じポイントを作ります;それは教師のコーナーであったと思います)で思います。なんとか見つけられたら、参考にさせていただきます。

編集:ここにあります:

EH Oliver(1972)、A Maximum Likelihood Oddity、
The American Statistician、Vol 26、Issue 3、June、p43-44

(出版社リンク

簡単に理解できる場合は一見の価値がありますが、DorpとKotzの章では関連する問題のほとんどを取り上げているため、重要ではありません。


コメント内の質問のフォローアップとして-コーナーを「平滑化」する方法を見つけることができたとしても、複数の極大値を取得できるという事実に対処する必要があります。

2つのローカルマックス

ただし、(モーメント法よりも優れた)非常に優れた特性をもつ推定量を見つけることができる場合があります。しかし、(0,1)の三角形のMLは、数行のコードです。

膨大な量のデータであれば、それでも対応できますが、別の問題だと思います。たとえば、すべてのデータポイントが最大になるとは限らないため、作業量が減り、他にもいくつかの節約ができます。


ありがとう-私は失敗した試みを投稿して、私が話しているディストリビューションとブロックされていると思う場所を示します。
フランク

詳しい説明ありがとうございます!私は別のアイデアも持っていました:三角形の分布に収束する関数のファミリーを見つけることができたとしても、区分的ではない-それを使用してMLEを分析的に導き出し、限界を取り、私が三角分布自体?
フランク

おそらく-それは使用する特定の制限プロセスに依存する可能性があると思います...おそらくいくつかの極大値に終わる可能性が高いので、とにかく極端な次数の統計値に近い可能性を評価するだけで済むでしょう。うまくいったのに、どうしてそんなに複雑なことをしようとするのですか 三角分布のMLの何が問題になっていますか?実際に行うのは非常に簡単です。
Glen_b-モニカを2013

2
私は言わなければなりません、順序統計に基づくcのこのMLEはかなりいいですが、上記の章での導出はいくらかの作業を必要としますが(それほど難しくはありません)-MLEの本質がargmaxにあることの素晴らしい説明(もちろん!)、デリバティブではなく(ご指摘のとおり、私も完全に同意しますが、 "通常の"デリバティブステップの上流で作業することになりました(つまり、何らかの方法で最大化について心配するだけですが)。
フランク

1
xi
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.