複数の代入と期待値の最大化(EM)の相対的な利点


8

私は問題を抱えています

y=a+b

私はyを観察しますが、もも観察ません。見積もりたいbab

b=f(x)+ϵ

ある種の回帰モデルを使用し、を推定できます。これは私にを与えます。次に見積もることができましたBab^

b^=f(x)+ϵ

最初の問題:回帰モデルが予測するにつながる可能性があるは何の意味も持たないだろうという負、。これを回避する方法はわかりません(私がよく扱った種類の問題ではありません)。他の人が日常的に扱っているようなもののようです。なんらかの非ガウスGLM?Bab^

主な問題は、推定から生じるメインモデルの不確実性をどのように説明するかです。欠けている共変量に対して以前に複数の代入を使用しました。しかし、これは「潜在的なパラメーター」が欠けているものです。代わりに、それは結果データであり、代入するのは問題ないようです。ただし、「潜在的な」パラメーターに使用されるEMについてよく耳にします。なぜかはわかりませんが、EMがこれらのコンテキストで優れているかどうかもわかりません。MIは、理解、実装、およびコミュニケーションの両方で直感的です。EMは直感的に理解できますが、実装するのがより難しいように見えます(私はそれを行っていません)。 b^

私が上で得た種類の問題に対してEMは優れていますか?もしそうなら、なぜですか?次に、線形モデルまたはセミパラメトリック(GAM)モデルのRでそれをどのように実装しますか?


1つのアイデアは、ベータ分布を使用してc = aをモデル化することです、次いでセット B =Y1 - Cc=ayb^=y(1c^)
probabilityislogic

回答:


1

GLMを使用することが理にかなっているかどうかは、の分布に依存します。全体として非線形最小二乗モデルを使用する傾向があります。y

だからあなたの回帰モデルである場合ここで、Zは、予測因子であり、αは、のための回帰モデルのパラメータであり、そしてためのモデルBがである、B = F X + εが、ここであります非負になるように制限されているため、と記述して、次のようにモデルを近似できます。a=Zα+νZαabb=f(x)+ϵf x = exp ψ x f(x)f(x)=exp(ψ(x))

y=Zα+exp(ψ(x))+η

ここで、は2つの個別のノイズ項の合計です。(エラーなしでを本当に意図している場合は、別の方法で行う必要があります。これは、統計問題ではなく、近似問題であり、おそらく無限大ノルムを確認する必要があります。)Y = +のBηy=a+b

3次回帰スプラインを入力すると、一般的な滑らかな関数を取得する簡単な方法の1つになります。そのモデルは、非線形最小二乗法で近似できます。(実際、一部のアルゴリズムはの線形性を利用して計算を簡略化および高速化できます。)Aψa

またはについて何を想定するかに応じて、代わりに実行できる他の処理があります。fyf

それはまだ帰属問題に対処していません。ただし、この種のモデルフレームワークは、EMの使用に関する提案のようなものに挿入できます。


a^

それはあなたの質問で綴られるべき多くの関連情報だと思います。
Glen_b-2013
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.