スチューデントのt分布のパラメーターの推定


23

スチューデントのt分布のパラメーターの最尤推定量は何ですか?それらは閉じた形で存在しますか?簡単なGoogle検索では結果が得られませんでした。

今日は単変量のケースに興味がありますが、おそらくモデルを複数の次元に拡張する必要があります。

編集:私は実際には主に場所とスケールのパラメータに興味があります。今のところ、自由度パラメーターが固定されていると仮定し、場合によっては後で数値を使用して最適値を見つけることができます。


私の知る限り、それらは閉じた形では存在しません。勾配上昇型アプローチが必要になる場合があります。
パット

スチューデントのt分布には単一のパラメーターがありますが、複数の「パラメーター」を参照します。おそらく場所やスケールのパラメータを含めていますか?
whuber

@whuber、コメントのおかげで、私は確かに自由度よりも場所とスケールのパラメータに興味があります。
-Grzenio

データ、位置パラメータの尤度式は次の多項式に代数的に等価である2 N - 1。そのような多項式のゼロが「閉じた形」で与えられると考えますか?n2n1
whuber

@whuber、小さなnに特別な場合、たとえばn = 3がありますか?
-Grzenio

回答:


27

Tには閉じた形式は存在しませんが、非常に直感的で安定したアプローチはEMアルゴリズムによるものです。学生は法線のスケール混合物であるため、次のようにモデルを記述できます。

yi=μ+ei

ここで及びW IG νei|σ,wiN(0,σ2wi1)。これは、条件付きでwiでmleが単に加重平均と標準偏差であることを意味します。これが「M」ステップですwiGa(ν2,ν2)wi

σ 2=ΣIW、IYI - μ2

μ^=iwiyiiwi
σ^2=iwi(yiμ^)2n

これで、「E」ステップはをすべてのデータが与えられた期待値に置き換えます。これは次のように与えられます:wi

w^i=(ν+1)σ2νσ2+(yiμ)2

したがって、上記の2つのステップを繰り返し、各方程式の「右側」を現在のパラメーター推定値に置き換えます。

大きな残差との観測は、位置の計算に少ない重量を受けるので、これは非常に簡単にt分布のロバスト性を示すの計算に、および有界影響σ 2。「有界影響」によって私が意味するものの推定値への寄与σ 2所与の閾値を超えることができないi番目の観測から(これはν + 1 σ 2 O リットルD EMアルゴリズムで)。また、νは「堅牢性」パラメータであり、νを増加(減少)させると、重みがより均一(より少ない)になり、外れ値に対する感度がより(より少なく)なります。μσ2σ2(ν+1)σold2νν

注意すべきことの1つは、対数尤度関数に複数の静止点がある可能性があるため、EMアルゴリズムがグローバルモードではなくローカルモードに収束する可能性があることです。ロケーションパラメータが異常値に近すぎて開始されると、ローカルモードが見つかる可能性があります。したがって、これを避けるには中央値から始めるのが良い方法です。


1
すごい。私は、ガウス分布の混合物のように見えるという正確な理由から、EMを使用するスチューデントtのフィッティングのアイデアをいじっていました。あなたが与える更新式の引用/参照はありますか?そうすることで、この投稿の素晴らしさをさらに高めることができます。
パット

実際、スチューデントtの混合モデル(私はこれを使用するつもりです):厳密な登録のための堅牢なフレームワークとしてのスチューデントt分布の混合のために、私は自分自身を見つけたと思います。Demetrios Gerogiannis、Christophoros Nikou、Aristidis Likas。Image and Vision Computing 27(2009)1285–1294。
パット

この質問への私の答えのリンクには、尤度関数の負荷と負荷のための非常に一般的なEMフレームワークがあります-分位、学生、ロジスティック、および一般的な回帰を行います。特定のケースは、共変量のない「回帰」であり、インターセプトのみであるため、このフレームワークにうまく適合します。また、このフレームワークに組み込むことができるペナルティ条件は膨大です。
確率論的

@probabilityislogicは本当にすてきです!また、も不明な場合はどうなりますか?参考にしてください。たぶん最高ここ:stats.stackexchange.com/questions/87405/...ν
クォーツ

この参照は@Patよりも優れていると思います。「EMおよびその拡張機能、ECMおよびECMEを使用したt分布のML推定」ローカル最適の問題のため、EMアルゴリズムの実行中は初期パラメーター値の選択に非常に注意する必要があります。言い換えれば、データについて何かを知る必要があります。通常、研究ではt分布を使用しません。

4

次のペーパーは、投稿された問題に正確に対応しています。

Liu C.およびRubin DB1995。「EMおよびその拡張機能、ECMおよびECMEを使用したt分布のML推定」。Statistica Sinica 5:19–39。

自由度の知識の有無にかかわらず、一般的な多変量t分布パラメーター推定を提供します。手順はセクション4に記載されており、1次元の確率論に非常によく似ています。


7
あなたが参照する論文には質問に対する有用な回答が含まれているように聞こえますが、回答はスタンドアロンであり、外部リソースを必要としない場合に優れています(たとえば、OPまたは読者がこの論文にアクセスできない可能性があります)。スタンドアローンにするために少し答えを具体化していただけますか?
パトリッククーロンブ

3

I doubt that it exists in closed form: if you write any one of the factors of the likelihood as

Γ(ν+12)νπΓ(ν2)(1+t2ν)ν+12=Γ(ν+12)νπΓ(ν2)exp{[ln(1+t2ν)][ν+12]}
and take the ln of that, you will get a nonlinear equation in ν. Even if you manage to get a solution, then depending on the number of factors (terms) n, the MLE equation is going to depend on this n in a nontrivial way. All that dramatically simplifies, of course, when ν, when the power approaches an exponential (Gaussian PDF).

1
Even in the Gaussian setting the log likelihood is nonlinear in its parameters :-).
whuber

I am actually interested in location and scale parameters, more than in the degrees of freedom. Please see edit to the question, and sorry for being not precise.
Grzenio

2

I have recently discovered a closed-form estimator for the scale of the Student's t distribution. To the best of my knowledge, this is a new contribution, but I would welcome comments suggesting any related results. The paper describes the method in the context of a family of "coupled exponential" distributions. The Student's t is referred to as the Coupled Gaussian, where the coupling term is the reciprocal of the degree of freedom. The closed-form statistic is the geometric mean of the samples. Assuming a value of the coupling or degree of freedom, an estimate of the scale is determined by multiplying the geometric mean of the samples by a function involving the coupling and a harmonic number.

https://arxiv.org/abs/1804.03989 Use of the geometric mean as a statistic for the scale of the coupled Gaussian distributions, Kenric P. Nelson, Mark A. Kon, Sabir R. Umarov

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.