MLEにはiidデータが必要ですか?それとも独立したパラメーターですか?


16

最尤推定(MLE)を使用してパラメーターを推定するには、分布ファミリー(P(X = x |θ)のパラメーター空間(θ)で発生するサンプル(X)の確率をマッピングします。 )θの可能な値(注:私はこれで正しいですか?)。私が見たすべての例は、F(X)の積を取ることによってP(X = x |θ)を計算することを含みます。 θおよびXの値はサンプル(ベクトル)です。

データを乗算するだけなので、データが独立していることになりますか?たとえば、MLEを使用して時系列データを適合させることはできませんか?または、パラメーターは独立している必要がありますか?

回答:


14

尤度関数は、モデルパラメーターθの関数としてのイベントE(データセットx)の確率として定義されます。Eバツθ

Lθ;バツPイベント E;θ=P観察する バツ;θ

したがって、観測値の独立性の仮定はありません。古典的なアプローチでは、パラメーターはランダム変数ではないため、パラメーターの独立性の定義はありません。関連する概念には、識別可能性、パラメーターの直交性、および最尤推定量(ランダム変数)の独立性があります。

いくつかの例、

(1)。個別のケースと(独立した)別個の観察の試料であるP観察  XのJ ; θ > 0、次いでバツ=バツ1バツnP観察する バツj;θ>0

Lθ;バツj=1nP観察する バツj;θ

特に、 バツj二項式Nθで、知られている、我々はそれを持っていますN

L(θ;x)j=1nθxj(1θ)Nxj.

(2)。連続近似。ましょう連続確率変数からのサンプルであるX分布、Fおよび密度F測定エラーと、ε、これは、あなたがセットの観察X J - ε X j + ϵ 。それからx=(x1,...,xn)XFfϵ(xjϵ,xj+ϵ)

L(θ;x)j=1nP[observing (xjϵ,xj+ϵ);θ]=j=1n[F(xj+ϵ;θ)F(xjϵ;θ)]

が小さい場合、これは(平均値定理を使用して)近似できます。ϵ

L(θ;x)j=1nf(xj;θ)

通常のケースの例については、こちらをご覧ください。

(3)。従属およびマルコフモデル。仮定しおそらく依存観察のセットであるとlet fが共同密度であるX次いで、x=(x1,...,xn)fx

L(θ;x)f(x;θ).

さらに マルコフ特性が満たされる場合、

L(θ;x)f(x;θ)=f(x1;θ)j=1n1f(xj+1|xj;θ).

これも見てください。


3
From the you write the likelihood function as a product, you are implicitly assuming a dependence structure among the observations. So for MLE one needs two assumptions (a) one on the distribution of each individual outcome and (b) one on the dependence among the outcomes.

10

(+1) Very good question.

マイナーなものは、MLEの略最大あなただけの可能性を最大化することを意味し、尤推定値(倍数ではありません)。これは、IIDサンプリングによって尤度を生成する必要があることを指定していません。

サンプリングの依存関係を統計モデルに記述できる場合、それに応じて尤度を記述し、通常どおり最大化します。

依存性を仮定しない場合に言及する価値がある1つのケースは、多変量ガウスサンプリングのケースです(たとえば、時系列分析)。2つのガウス変数間の依存関係は、共分散項によってモデル化できます。共分散項は、尤度に組み込まれません。

簡単な例を示すために、サイズのサンプルを描くと仮定します 2同じ平均と分散を持つ相関ガウス変数から。あなたは可能性を次のように書くでしょう

12πσ21ρ2exp(z2σ2(1ρ2)),

where z is

z=(x1μ)22ρ(x1μ)(x2μ)+(x2μ)2.

This is not the product of the individual likelihoods. Still, you would maximize this with parameters (μ,σ,ρ) to get their MLE.


2
These are good answers and examples. The only thing I would add to see this in simple terms is that likelihood estimation only requires that a model for the generation of the data be specified in terms of some unknown parameters be described in functional form.
Michael R. Chernick

(+1) Absolutely true! Do you have an example of model that cannot be specified in those terms?
gui11aume

@gu11aume I think you are referring to my remark. I would say that I was not giving a direct answer to the question. The answwer to the question is yes because there are examples that can be shown where the likelihood function can be expressed when the data are genersted by dependent random variables.
Michael R. Chernick

2
Examples where this cannot be done would be where the data are given without any description of the data generating mechanism or the model is not presented in a parametric form such as when you are given two iid data sets and are asked to test whether they come from the same distribution where you only specify that the distributions are absolutely continuous.
Michael R. Chernick

4

Of course, Gaussian ARMA models possess a likelihood, as their covariance function can be derived explicitly. This is basically an extension of gui11ame's answer to more than 2 observations. Minimal googling produces papers like this one where the likelihood is given in the general form.

Another, to an extent, more intriguing, class of examples is given by multilevel random effect models. If you have data of the form

yij=xijβ+ui+ϵij,
where indices j are nested in i (think of students j in classrooms i, say, for a classic application of multilevel models), then, assuming ϵijui, the likelihood is
lnLilnjf(yij|β,ui)dF(ui)
and is a sum over the likelihood contributions defined at the level of clusters, not individual observations. (Of course, in the Gaussian case, you can push the integrals around to produce an analytic ANOVA-like solution. However, if you have say a logit model for your response yij, then there is no way out of numerical integration.)

2
Stask and @gui11aume, these three answers are nice but I think they miss a point: what about the consistency of the MLE for dependent data ?
Stéphane Laurent
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.