一般的なバージョン:
私は推定する必要があると連続して多変量です。良い関数形を心に留めておらず、は公平なものである必要があるため、ノンパラメトリックにしたいと思います。条件付きカーネル密度推定器を使用したかったのですが、最初にを量子化する必要があることに気付きました。それから私は推定するためのアイデアだったとF(X )という計算にデータや使用からのF(A | X )、または多分私はどこかでそれを読んで、覚えていませんどこ。A X F(A | X )X F(A 、X )
この手順が有効ではない理由はありますか?カーネル密度よりも良いまたはより正直なアプローチはありますか?また、ノンパラメトリックにサンプル密度から人口密度を推定することに問題はありますか?データは調査データであり、私には調査の重みがあります。どういうわけかそれらを組み込む必要がありますか?
ケース固有のバージョン:
Robins(2000)(ゲートされていないPDF)のように、これらの推定値を周辺構造モデルでの治療の確率の逆数の重みに使用することに言及する価値があるでしょう。私は「治療」の配列観察と時間変動交絡因子のシーケンスいくつかの結果に対するで生じる。単純なパラメトリック因果関係、ただし、時変交絡因子があるため、βは「平均治療効果」の偏った推定であり、因果パス上にあるため、交絡因子をリグレッサとして追加できません。βにもバイアスをかけます。幸いドクロビンスはI再重量私の観測場合、私はにより交絡/公平かつ合理的に効率的な推定値を得ることができることを考え出した wが、私は= 4 Π S=0、F(S|A S < T)を
私の質問:その重みのシーケンスは、実際に見積もりが必要なものです。ロビンスはロジスティック回帰を推奨しています。しかしは[ 0 、∞ )7にあり、{ 0 、… } 7で測定され、すべての実際的な目的のために、その有限サブセットにあります。x tは閉じた間隔にありますが、それは実際にはいくつかの変数の平均であり、それぞれが{ 0 、… 、12 }の有限サブセットで測定されているためです。
だから私はいくつかのアイデアを持っていました:
- およびf (x 、a s < t)をノンパラメトリックに推定
- ベータ回帰を使用してを推定し、ノンパラメトリックにf (x s < t、a s < t)を推定します
- 推定値ベータ回帰と、および推定値F (T、S < T、X S < (T - 1 )))ベータ回帰を「連鎖」させて、全体を条件付きとして表現します。
- 確かに私が考えていなかった、不確実性の伝播において実際に首尾一貫して正直なもの。
- ベイズ?私はスタンとJAGSを知っていますが、MCMCはおそらく私のコンピューターを爆発させます(EC2を扱いたくありません)。
因果モデリングでは多変量処理はまれであるため、文献にはヒントはありません。私は何をすべきか?
ボーナスポイント:→ a t − 1のようなものではなく、{ a s } t s = 0を表す表記についてどう思いますか?