ノンパラメトリック推定:2つの連続変数の相互作用


4

バイナリの結果を観察する確率はy、2つの変数の関数ですy = f(x1, x2)

両方x1x2連続している、と私はの関数形には前を持っていませんf。私はカーネル密度推定の浅い知識を持っていますが、一変量変数の場合にそれを行うことしか見ていません。ここでどのように進める必要がありますか/これに関するいくつかの基本的な文献はありますか?


この種の質問がここで話題になっているかどうかはわかりませんし、議論に参加したくありませんが、私は本当にstats.stackexchange.comでそのような質問をしたでしょう。彼らはこの種の要求に本当に精通しています。

回答:


1

(最初は質問を誤解していた)モデルはバイナリのノンパラメトリック回帰です。私はクラインによるセミパラメトリックモデルを知っているとSpady、一般的なモデルを知らない http://www.ssc.wisc.edu/~bhansen/718/NonParametrics7.pdf せ、次のようにモデルがある 次に。リンクの詳細。別の可能性は、ジョイント分布(離散変数と連続変数の両方を持つ)を推定することです。g(y、x)をジョイントpdfとし、推定します。x´=[x1´x2´]P(y=1|x)=E[y=1|x]=g(xβ)=f(x)g(y|x)=g(y,x)g(x)=f(x)。このタイプのジョイントの推定には、カテゴリカルデータと連続データの両方で回帰関数のノンパラメトリック推定をチェックできる製品カーネルが必要です。Journalof Econometrics、第119巻、2004年3月、99〜130ページ

以下のための連続、次の回答作品。まず第一に、データは確定的またはランダムです。決定論的であれば、補間を行いたいかもしれません。スプラインが最適なオプションです。データセットにノイズがある、または観測されていない変数があると思われる場合は、ノンパラメトリック回帰を実行できます。これはあなたが望むものだと思います。最初のステップは、実際にランダム性の構造について仮定することです。通常の仮定は、 あり、観測されていない変数直交-とすることです。次に、を高次多項式で置き換えることができます。yy=f(x1,x2)+ϵX ε F X E [ Y | x ] = f x 1x 2E [ y | X ] = ∫のYのF Y | X のD のY F Y | X = F Y X x´=[x1´x2´]xϵfx非線形最小二乗を使用してこれを推定します。技術的には級数または多項式推定器と呼ばれます(fがわかっている場合はNLSが使用されますが、高次の多項式は真のfに近似すると主張できます)。
別の方法は、「カーネル」アプローチを使用することです。実際、fが条件付き期待値であると直接仮定できます。 。その場合、条件付き期待値 をE[y|x]=f(x1,x2)E[y|x]=yf(y|x)dyf(y|x)=f(y,x)f(x)。この要素をカーネル推定器で置き換えると、Nadaraya-Watson推定器が得られ、グーグルで検索できます。3番目のオプションは、ローカル線形回帰を使用することです。より高度なオプションは、関数基底を使用してモデルを推定するSieves推定器を使用することです。fが条件付きの期待値ではない場合、インストルメンタル変数でノンパラメトリック回帰を使用する必要があります。これについては、Renault(およびその他)によるEconometricaに関する論文があります。要約すると、想定しているランダム構造に依存します。ノンパラメトリック回帰を学びたい場合に行くべき本は、Li&Racine http://press.princeton.edu/titles/8355.html です。これらの計量経済学の手順は、オープンソースの統計言語「R "(パッケージ)" np "という名前で。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.