Rの複雑な調査データへのマルチレベルモデルの近似


11

Rのマルチレベルモデルで複雑な調査データを分析する方法に関するアドバイスを探していsurveyます。1レベルモデルでの選択の等しくない確率を重み付けするためにパッケージを使用しましたが、このパッケージにはマルチレベルモデリングの機能がありません。このlme4パッケージはマルチレベルモデリングに最適ですが、クラスタリングのさまざまなレベルで重みを含める方法を知る方法はありません。Asparouhov(2006)は問題を設定します:

マルチレベルモデルは、クラスターサンプリング設計からのデータを分析するために頻繁に使用されます。ただし、このようなサンプリング設計では、クラスターレベルと個々のレベルで選択の確率が等しくないことがよくあります。サンプリングの重みは、これらの確率を反映するために、1つまたは両方のレベルで割り当てられます。いずれかのレベルでサンプリングの重みが無視された場合、パラメーター推定値は大幅にバイアスされる可能性があります。

2レベルモデルの1つのアプローチは、MPLUSに実装されているマルチレベルの疑似最尤(MPML)推定器です(Asparouhov et al、?)。Carle(2009)は主要なソフトウェアパッケージをレビューし、続行方法についていくつかの推奨事項を作成します。

複雑な調査データと設計の重みでMLMを適切に実施するには、アナリストは、プログラムの外部でスケーリングされた重みを含み、自動プログラム変更なしで「新しい」スケーリングされた重みを含むことができるソフトウェアが必要です。現在、3つの主要なMLMソフトウェアプログラムがこれを可能にしています:Mplus(5.2)、MLwiN(2.02)、およびGLLAMM。残念ながら、HLMもSASもこれを行うことはできません。

WestとGalecki(2013)はさらに最新のレビューを提供しています。関連する一節を詳しく引用します。

時折、アナリストは、複雑なデザインのサンプルから収集されたデータセットを調査するためにLMMを適合させたいと望んでいます(Heeringa et al、2010、Chapter 12を参照)。複雑なサンプル設計は、一般に、人口を層に分割すること、層内から個人のクラスターを多段階で選択すること、およびクラスターとサンプリングされた最終的な個人の両方の選択確率が等しくないことを特徴とします。これらの等しくない選択確率は、一般的に個人のサンプリング重みの構築につながり、分析に組み込まれたときに記述パラメータの公平な推定を保証します。これらの重みは、調査の非応答用にさらに調整され、既知の母集団の合計に合わせて調整される場合があります。伝統的に、アナリストは、回帰モデルを推定するときに、これらの複雑なサンプリング機能を組み込むための設計ベースのアプローチを検討する場合があります(Heeringa et al。、2010)。最近では、統計学者がこれらのデータを分析するためのモデルベースのアプローチを模索し始めており、LMMを使用してサンプリング層の固定効果とサンプリングされたクラスターのランダム効果を組み込んでいます。

これらのデータを分析するためのモデルベースのアプローチの開発における主な困難は、サンプリングの重みを組み込むための適切な方法を選択することでした(問題の概要については、Gelman、2007を参照してください)。Pfeffermann et al。(1998)、Asparouhov and Muthen(2006)、およびRabe-Hesketh and Skrondal(2006)は、調査の重みを組み込んだ方法でマルチレベルモデルを推定する理論を開発しました。Rabe-HeskethおよびSkrondal(2006)、Carle(2009)そしてHeeringa等。(2010年、第12章)は、現在のソフトウェア手順を使用したアプリケーションを提示していますが、これは引き続き統計研究の活発な分野です。LMMをフィッティングできるソフトウェア手順は、これまでに複雑な設計機能を組み込むために文献で提案されてきたアプローチを実装するさまざまな段階にあります。分析者は、LMMを複雑なサンプル調査データにフィッティングするときにこれを考慮する必要があります。複雑なサンプル調査から収集されたデータにLMMをフィッティングすることに関心のあるアナリストは、調査の重みを推定手順(HLM、MLwiN、Mplus、xtmixed、およびgllamm)に正しく組み込むことができる手順に惹かれます。範囲。

これは私に私の質問をもたらします:Rの複雑な調査データにLMMをフィッティングするためのベストプラクティスの推奨事項はありますか?


1
こんにちはエリック、開始がWIHという段落内のリンクi've never said it beforeからaddhealth上でこのポスト興味があるかもしれません。.. :(
アンソニーDamico

1
@AnthonyDamico、リンクが壊れています:-(
Ben Bolker

@BenBolkerです!私もやって:)新しい場所を彼らは、ミクロの名前を変更した: asdfree.com/search/label/...
アンソニーDamico

質問の解釈を間違えた場合は申し訳ありませんが、私の理解では、実験の設計からの(既知の)重みが固定されており、これらの設計の重みを含む線形混合モデルを使用したいと考えています。パッケージlmer内の関数では、モデルフィッティングプロセスの引数を指定できるため、固定デザインの重みがある場合は、それらをその引数に組み込むことができます。ここで棒の端が間違っていますか?これがあなたのニーズに不十分である何らかの理由がありますか?lme4weights
ベン-モニカを

回答:


4

私が知る限り、実際に混合モデルが必要な場合(たとえば、分散コンポーネントに関心がある場合)、現時点ではRでこれを実際に行うことはできません。

重み引数はlme4::lmer() ありませんので、あなたがやりたいlmer()精密重みとして解釈重みが重みをサンプリングしていないよう。通常の線形モデルと一般化線形モデルとは対照的に、混合モデルのサンプリングの重みを精度の重みとして扱うコードでは、正確なポイント推定を取得することさえできません。

分散成分を推定する必要がなく、モデルのマルチレベル機能で正しい標準誤差を取得する場合は、を使用できますsurvey::svyglm()


0

WeMixのパッケージには、少なくとも、線形およびロジスティックマルチレベルモデルのため、オプションになりました。StataやMPlusでこれらのモデルを実行する場合と比較すると、非常に遅いようです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.