逆確率重みの計算—条件付き(多変量)密度推定?


8

一般的なバージョン:

私は推定する必要があると連続して多変量です。良い関数形を心に留めておらず、は公平なものである必要があるため、ノンパラメトリックにしたいと思います。条件付きカーネル密度推定器を使用したかったのですが、最初にを量子化する必要があることに気付きました。それから私は推定するためのアイデアだったとFX という計算にデータや使用からのFA | X 、または多分私はどこかでそれを読んで、覚えていませんどこ。A X FA | X X FA X f(A|X)AXf^(A|X)Xf^(A,X)f^(X)f^(A|X)

この手順が有効ではない理由はありますか?カーネル密度よりも良いまたはより正直なアプローチはありますか?また、ノンパラメトリックにサンプル密度から人口密度を推定することに問題はありますか?データは調査データであり、私には調査の重みがあります。どういうわけかそれらを組み込む必要がありますか?


ケース固有のバージョン:

Robins(2000)ゲートされていないPDF)のように、これらの推定値を周辺構造モデルでの治療の確率の逆数の重みに使用することに言及する価値があるでしょう。私は「治療」の配列観察{at}t=04と時間変動交絡因子のシーケンス{xt}t=04いくつかの結果に対するy~で生じるt=T+1。単純なパラメトリック因果関係、ただし、時変交絡因子があるため、βは「平均治療効果」の偏った推定であり、因果パス上にあるため、交絡因子をリグレッサとして追加できません。βにもバイアスをかけます。幸いドクロビンスはI再重量私の観測場合、私はにより交絡/公平かつ合理的に効率的な推定値を得ることができることを考え出した wが、私は= 4 Π S=0、FS|A S < T)をE[Y~|a]=βaββ

wi=s=04f(as|as<t)f(as|as<t,xs<t

私の質問:その重みのシーケンスは、実際に見積もりが必要なものです。ロビンスはロジスティック回帰を推奨しています。しかし[ 0 7にあり、{ 0 } 7で測定され、すべての実際的な目的のために、その有限サブセットにあります。x tは閉じた間隔にありますが、それは実際にはいくつかの変数の平均であり、それぞれが{ 0 12 }の有限サブセットで測定されているためです。at[07{0}7バツt{0,,12}

だから私はいくつかのアイデアを持っていました:

  1. およびf x a s < t)をノンパラメトリックに推定f(at,as<t,xs<t)f(x,as<t)
  2. ベータ回帰を使用してを推定しノンパラメトリックにf x s < ta s < t)を推定しますf(at|as<t,xs<t)f(xs<t,as<t)
  3. 推定値ベータ回帰と、および推定値F TS < TX S < T - 1 )ベータ回帰を「連鎖」させて、全体を条件付きとして表現します。f(xt1|at,as<t,xs<(t1))f(at,as<t,xs<(t1))
  4. 確かに私が考えていなかった、不確実性の伝播において実際に首尾一貫して正直なもの。
  5. ベイズ?私はスタンとJAGSを知っていますが、MCMCはおそらく私のコンピューターを爆発させます(EC2を扱いたくありません)。

因果モデリングでは多変量処理はまれであるため、文献にはヒントはありません。私は何をすべきか?

ボーナスポイント:a t 1のようなものではなく、{ a s } t s = 0を表す表記についてどう思いますか?as<t{as}s=0tat1

回答:


10

基本的な考え方

どおりチェン、リントン、及びロビンソン(2001) 、条件変量カーネル密度推定のための「デフォルト」技術は、帯域幅のために、見つけることであるB CF BY Z a,b,c

f^ab(y,z)f^c(z)=f^abc(y|z

(a,bca=b=cy=xt,z=xt1

na2(f^abc=aaa(y|z)f(y|z))dN(0,V)

V^=(K(u)2du)2f^aaa(y|z)f^a(z)=(K(u)2du)2f^aa(y,z)

私は頻繁に加重モデルを見たことがありませんが(イントロスタットWLSでさえ)、推定された重みの分散を説明しようとします。とりあえずその慣習に従いますが、ここで結果が得られたら、不確実性をより正直に伝える完全なベイジアンモデルにそれを組み込めるかどうかを確認します。したがって、はい、結合密度と限界密度を推定することによって条件付き密度を推定することは、標準的な手順です。

私のケースへの適用性

y=xtz=(xs)s=1t1xs=(xs,1xs,D)x=((xs,d)d=1D)s=1t1

帯域幅

B=(Bnumerator00Bdenominator)=((a1,1B1numB2numat,D)00(c1,1B1denomB2denomct1,D))

H=hH0|H0|=1bN4+DBnumBdenomB

a=b=czyzz=μμa^(μ)

同じ結果のより一般的なバージョンは、「経験則」帯域幅と呼ばれるこれらの講義ノートの別のセクションにあります。また、一般的な相互検証手順の関数として最適な帯域幅を導き出します。

計算

私は3つの期間にわたって7次元の処理を行っているため、推定できるのは最大21次元の密度です。そして、ベースラインの共変量について忘れていました。30のベースライン共変量があるので、結局、51次元分布、44次元分布、および37次元分布を推定しようとします。そして、それは極端な次元が非常に大きなサンプルを必要とすることは言うまでもありません。スコット&ワンド(1991) 1次元の50のサンプルサイズは優に超える100万8次元のと等価であることを報告... 30.ノー量の言及これらは私が今感じてどのように表現することはできません。

結論

だから私はこれで一週間の人生を無駄にしました。しかたがない。代わりに、MCMCを使用してパラメトリック治療と結果モデルを同時に適合させ、IPTの重みが最終的に治療モデルの事後予測密度の関数になるようにします。次に、処理モデルの線形、2次、および3次のフォームをステップ実行し、どれが最も適しているかを確認します。


6
「だから私はこれで一週間の人生を無駄にしただけだ。」それは学習と研究と呼ばれています。修士学生であることを受け入れる必要があります。多くの場合、誰も方法を知らないため、通常、研究にショートカットはありません。
モモ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.