異なるサンプルサイズのグループ平均に基づく予測変数がある場合、何ができますか?


14

結果あり、それがいくつかの予測子とどのように関係するかという古典的なデータ分析の問題を考えてみましょう。ここで念頭に置いたアプリケーションの基本的なタイプは、 X I 1X i pYiXi1,...,Xip

  1. Yiは、都市iの犯罪率などのグループレベルの結果iです。

  2. 予測子は、都市iの人口統計学的特徴などのグループレベルの特性ですi

基本的な目標は、回帰モデルを適合させることです(おそらくランダム効果を使用しますが、今のところは忘れてください)。

E(Yi|Xi)=β0+β1Xi1+...+βpXip

1つ(または複数)の予測変数が、ユニットごとに異なるサンプルサイズを持つ調査の結果である場合、いくつかの技術的な困難が生じますか?例えば、仮定Xi1都市の要約スコアであるiの都市からの個体の試料からの平均応答であるiが、サンプルは、これらの平均値をに基づいていたサイズが乱暴に異なっています。

CtySample sze120210033004553

予測変数のすべてが同じ意味を持つわけではないため、ある意味では、各都市で、回帰モデルでこれらの変数をすべて「同等に作成された」ように条件付けすると、誤解を招く推論が発生する可能性があります。

このタイプの問題の名前はありますか?もしそうなら、これを処理する方法についての研究はありますか?

私の考えは、誤差で測定された予測変数としてそれを扱い、これらの線に沿って何かをすることですが、測定誤差に不均一分散性があるため、非常に複雑になります。私はこれを間違った方法で考えているかもしれませんし、これをもっと複雑にしているかもしれませんが、ここでの議論は役に立ちます。


8
これは、「変数の不均一なエラー」問題と呼ばれます。(このフレーズはGoogle検索の良いターゲットです。)最近(2007年)、DelaigleとMeisterはJASAの記事でノンパラメトリックカーネル密度推定量を提案しました。いくつかのパラメトリックメソッド(モーメント法とMLE)についての要約は、追加のアプローチを示しています:sciencedirect.com/science/article/pii/S1572312709000045 (特定のデータセットを処理する方法について信頼できる答えを提供するための研究に十分に精通していません。)
whuber

1
両方のコメントに対して@whuber +1。「変数のエラー」は私が探していた欠落しているキーワードだったと思います。誰も私が受け入れることができる強い答えを下に与えない場合、私は文献を調べて、答えとして最終的にやることを投稿するために戻ってきます。
マクロ

回答:



0

これに対処する1つの方法は、すべての都市が個々の応答に対して同じ分散分布を持っていると仮定することです。次に、予測子の各都市の平均測定値には分散。ここで、は都市平均の個人数です。それは、不均一分散性に対処する簡単な方法です。この形式の回帰問題の特別な名前は知りません。σ2Xiσ2/ninii


私は測定誤差をまったくモデル化する必要を避けたいと思っていましたが、それは理にかなっています。その方向に進んだ場合、エラーで測定された予測子の効果を推定するために何を使用しますか?SIMEXと呼ばれる1つの方法を使用しましたが、これは一般的ではないようで、他のオプションがあるかどうか疑問に思っています。
マクロ

@Macro推定する分散関数を使用して回帰をモデリングするための特定のソフトウェアに精通していません。
マイケルR.チャーニック

3
マクロは、ホモセダスティックな変数の誤差回帰の経験則として、IVの誤差がDVの誤差と比較して小さい場合、前者を安全に無視して通常の回帰に頼ることができます。これにより、問題をトリアージするための迅速で簡単な方法が得られます。
whuber

1
@whuber、ありがとう-それは便利です。その経験則が理にかなっている場合は、異分散の場合「IVの最大誤差分散がDVの誤差分散と比較して小さい場合、問題を安全に無視できます」を使用するのが理にかなっているようです私が見ているデータで実際に満たされる条件である合理的な経験則。
マクロ

1
@Michael、私が見ているデータでは、平均化されている測定値の分散はそれほど大きくありません。私がチェックしたがさんが言うようにする必要があると思います、その平均値の分散(もしその分散は単位にわたって一定であると言うのが妥当-私がチェックする必要があると思います別のもの)である、したがって、データセットのサンプルサイズの範囲はです。のエラー分散は1である可能性が高く、これよりも2桁大きい可能性があります(もう一度確認する必要があります)。σ211/n(.05,1)Yi
マクロ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.