ベイジアン階層型一般化線形モデルでの特徴選択


8

私は階層的なGLMを推定しようとしていますが、どの共変量を母集団レベルで含めるかを決定するための機能を選択しています。

観測値と可能な共変量を持つグループがあるとします。つまり、共変量\ boldsymbol {x} _ {(N \ cdot G)\ times K}、結果\ boldsymbol {y} _ {(N \ cdot G)\ times 1}。これらの共変量の係数は\ beta_ {K \ times 1}です。GNKx(NG)×Ky(NG)×1βK×1

仮定YBernoulli(p(x,β))

以下は、ロジットサンプリングモデルと正規分布グループ係数を使用した標準的な階層型ベイジアンGLMです。

L(y|x,β1,...βG)g=1Gt=1N(Pr{j=1|pt,βg})yg,t(1Pr{j=1|pt,βg})1yg,t

β1,...βG|μ,ΣiidNd(μ,Σ)

μ|ΣN(μ0,a1Σ)
ΣIW(v0,V01)

\ betaの次元数に(LASSOのように)鋭い特徴選択があるように、このモデルを変更(またはそれを実行するか、それを説明する作業を見つける)したいと思いβます。

(1)最も単純な最も直接的な方法は、母集団レベルでこれを正則化して、の次元数を本質的に制限し、すべてのが同じ次元になるようにすることです。μβ

(2)より微妙なモデルでは、グループレベルで収縮が発生し、次元は階層単位に依存します。β

1と2を解くことに興味がありますが、もっと重要なのは1です。

回答:


1

私が取り組む方法(1)には、次のようなスパイクとスラブのモデルが含まれます。

βg,k=zkmg,k

zkBern(p)

mg,kN(μ,Σ)

μ,ΣNIWv0(μ0,V01)

この:

  • 前のNIWからのの柔軟性を保持します。βμ,Σ
  • すべてのグループの変数の選択を一度にモデル化します。
  • groupのサブインデックスを追加し、各場所前に共通のベータを持つことで、簡単に拡張できます。zg,kk

もちろん、これは有効なアプローチがいくつかあるような問題だと思います。


2

機能の選択は、分析での大きな目標ではありません。すべての予測子が互いに相関せず、サンプルサイズが膨大でない限り、データは確実に答えを出すことができません。モデルの選択は、モデルの選択よりも重要です。詳細はRMSコースノートにあります。ただし、特徴を選択せず​​に縮小すること(たとえば、尾根またはペナルティ付き最尤推定)は良い考えです。階層的ベイジアンモデルは縮小モデルで統計的推論を可能にするので、より優れています。一方、頻度主義の世界では、縮小後に推論ツールのほとんどが失われます。L2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.