結果あり、それがいくつかの予測子とどのように関係するかという古典的なデータ分析の問題を考えてみましょう。ここで念頭に置いたアプリケーションの基本的なタイプは、 X I 1、。。。、X i p
は、都市iの犯罪率などのグループレベルの結果です。
予測子は、都市iの人口統計学的特徴などのグループレベルの特性です。
基本的な目標は、回帰モデルを適合させることです(おそらくランダム効果を使用しますが、今のところは忘れてください)。
1つ(または複数)の予測変数が、ユニットごとに異なるサンプルサイズを持つ調査の結果である場合、いくつかの技術的な困難が生じますか?例えば、仮定都市の要約スコアであるの都市からの個体の試料からの平均応答であるが、サンプルは、これらの平均値をに基づいていたサイズが乱暴に異なっています。
予測変数のすべてが同じ意味を持つわけではないため、ある意味では、各都市で、回帰モデルでこれらの変数をすべて「同等に作成された」ように条件付けすると、誤解を招く推論が発生する可能性があります。
このタイプの問題の名前はありますか?もしそうなら、これを処理する方法についての研究はありますか?
私の考えは、誤差で測定された予測変数としてそれを扱い、これらの線に沿って何かをすることですが、測定誤差に不均一分散性があるため、非常に複雑になります。私はこれを間違った方法で考えているかもしれませんし、これをもっと複雑にしているかもしれませんが、ここでの議論は役に立ちます。