タグ付けされた質問 「multilevel-analysis」

階層のいくつかのレベルで構成されるデータセットの統計分析(例:学校に入れ子にされたクラスに入れ子になった生徒、または階層的な予測)。混合モデルに関する質問については、[mixed-model]タグを使用してください。ネストされたランダム効果には、[nested-data]を使用します。

1
マルチレベルの多変量メタ回帰
背景: (1)いくつかの結果/構造(=多変量)と(2)異なる測定値のためにこれらの結果のすべてに複数の効果サイズがある研究を使用してメタ回帰を実行したいと思います。うまくいけばそれを最もよく説明するスキームがあります: 研究1、結果A、効果サイズ1 研究1、結果A、効果サイズ2 研究1、結果B、効果サイズ3 研究2、結果A、効果サイズ4 研究2、結果C、効果サイズ5 研究2、結果C、効果サイズ6 ... 研究は、異なる結果について2つのグループの平均を比較し、効果の大きさはヘッジのgです。 実用的な例は「ワーキングメモリー」であり、「音韻ループ」、「視覚空間スケッチパッド」、「中央エグゼクティブ」など、さまざまな結果に分割できます(Baddeley、1974)。 たとえば、スタディ1は2つの異なるメジャー(=効果サイズ1および2)で「音韻ループ」(結果A)を評価し、1つのメジャー(=効果サイズ3)で「中央エグゼクティブ」(結果B)を評価します。 問題: 適切な多変量アプローチでは、共分散を推定するために、効果サイズと結果の間のすべての相関関係を知る必要があります。ただし、(1)同じ研究内の異なる効果サイズ間の相関関係、および(2)異なる研究の結果間の相関関係はわかりません。それらを推定したり、少なくともいくつかの相関関係を見つけて作業したりすることはできますが、それは避けたい多くの追加の文献検索を意味します。 解決策(これまでのところ): 私は同様の問題を扱ういくつかの方法に出くわしました。 ロバストな分散推定(Hedges、2010)は、複数の効果サイズを処理するための優れたアプローチです。ただし、まだ相関関係を推測して感度分析を実行する必要があり、いくつかの結果を比較することもできないようです(つまり、単変量メタ回帰のみ)。 Van den Noorgateのマルチレベルアプローチ(2014)は、研究内の効果サイズ間および効果サイズ間での変動を可能にすることで相関を推定する必要がないため、有望です。マルチレベルの多変量メタ分析(=異なる結果と上記のスキームのような複数の効果サイズ)とマルチレベルの単変量メタ回帰(=複数の効果サイズですが、結果間の区別なし)について説明します。 Rでmetaforパッケージを使用して、両方のマルチレベルアプローチを組み合わせて、マルチレベルの多変量メタ回帰を実行できるかどうか疑問に思っています。metaforがここに与えられている使用してマルチレベルのメタ分析と多変量メタ回帰の例http://www.metafor-project.org/doku.php/analyses:konstantopoulos2011ここ(マルチレベル)とのhttp://www.metafor- project.org/doku.php/analyses:berkey1998(多変量)。(上にリンクされたマルチレベルの例は、実際には階層的な依存関係に対処するアプローチを説明していることに注意してください(たとえば、同じ研究室で実施された研究)。代わりに、Van den Noorgateによって説明されたマルチレベルのアプローチを使用します。) 変数: ES:効果サイズ(ヘッジのg) VI:効果サイズの分散 Pub_Year:メタ回帰の予測子としての発行年 ES_ID:すべての効果サイズには、所属する研究または結果に関係なく、一意のIDがあります。 Outcome_ID:所属する研究に関係なく、同じ結果のIDは同じです(たとえば、「Phonological Loop」= 1、「Central Executive」= 2)。 Study_ID:同じ研究の効果サイズは、それらが属する結果に関係なく、同じIDを持ちます(例:研究1の効果サイズ= 1、研究2 = 2の効果サイズ)。 多レベルの多変量メタ分析のためのメタフォーのRコード: rma.mv(ES、VI、mods =〜Outcome_ID -1、random = list(〜1 | Study_ID、〜1 | ES_ID)、data = data.set) …

2
マルチレベルモデルにおける切片勾配相関の効用について
彼らの著書「Multilevel Analysis:An Introduction to Basic and Advanced Multilevel Modeling」(1999)で、Snijders&Bosker(8章、セクション8.2、119ページ)は、切片と勾配の相関を、切片と勾配の共分散を除算して計算すると述べています。切片の分散と勾配の分散の積の平方根によって、-1と+1の間に制限されず、無限になることさえあります。 これを考えると、私はそれを信頼すべきだとは思いませんでした。しかし、私は説明するための例を持っています。人種(二分法)、固定効果としての年齢と年齢*人種、ランダム効果としてのコホート、およびランダム勾配としての人種二分法変数を含む私の分析の1つで、一連の散布図は、勾配が値全体であまり変化しないことを示しています私のクラスター(つまり、コホート)変数の変化、およびコホート全体で勾配がより少なくまたはより急になるのがわかりません。尤度比検定では、サンプルの合計サイズ(N = 22,156)にも関わらず、ランダムインターセプトモデルとランダムスロープモデル間の適合性が有意でないことも示されています。それでも、切片と傾きの相関は-0.80近くでした(これは、時間の経過に伴う、つまりコホート全体でのY変数のグループ差の強い収束を示唆しています)。 Snijders&Bosker(1999)がすでに述べていることに加えて、切片と勾配の相関を信頼しない理由を示す良い例だと思います。 マルチレベル研究で切片勾配相関を本当に信頼して報告する必要がありますか?具体的には、そのような相関関係の有用性は何ですか? 編集1:それは私の質問に答えるとは思わないが、gungは私に詳細情報を提供するように頼んだ。役立つ場合は、以下を参照してください。 データは一般社会調査からのものです。構文には、Stata 12を使用したので、次のようになります。 xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml cov(un) var wordsum 語彙テストのスコア(0-10)、 bw1 民族変数(黒= 0、白= 1)、 aged1-aged9 年齢のダミー変数であり、 …

3
理論、仮説、または問題に取り組むためにベイジアンアプローチが重要だったのはいつですか?
最近、リストサーブに質問が投稿されました。私は(おそらく皮肉なことに)生態学の分野での質問に対処するためにベイジアンのアプローチが「仕事を成し遂げる」ために非常に重要である場合、一般的に、ベイジアンアプローチが特定の分野で進歩するために不可欠であった時期について、私は疑問に思っています。 生態学では、ベイジアン法は大きく複雑なデータセットを使用する適用状況で最も頻繁に使用されるように思われるため、フィールドの重要または古典的な理論または仮説に関連する状況に特に関心があります。 たとえば、生態学では、ベイズ法が複雑な階層モデルに適合し、動物の個体数や生き物の個体数における個体の生存率などの正確な推定値を取得する唯一の方法のようです。ベイジアンアプローチが使用されたために、理論的な質問の書き込みが進行した例に精通していませんが、これは、p値が歴史的に評価された通貨であるANOVAのようなフレームワークにおける還元論的実験で生態学理論がしばしば対処されるためである可能性があります。

1
lmeオブジェクトから予測を取得する際のエラー
lmeオブジェクトから観測の予測を取得しようとしています。これは非常に簡単なはずです。しかし、さまざまな試行でさまざまなタイプのエラーが発生するため、何かが足りないようです。私のモデルは次のとおりです: model <- lme(log(child_mortality) ~ as.factor(cluster)*time + my.new.time.one.transition.low.and.middle + ttd + maternal_educ+ log(IHME_id_gdppc) + hiv_prev-1, merged0,na.action=na.omit,method="ML",weights=varPower(form=~time), random= ~ time| country.x, correlation=corAR1(form = ~ time), control=lmeControl(msMaxIter = 200, msVerbose = TRUE)) それはうまく動作し、データによく適合し、結果は理にかなっています。予測を得るために、私は以下を試しました: test.pred <- data.frame(time=c(10,10,10,10),country.x=c("Poland","Brazil", "Argentina","France"), my.new.time.one.transition.low.and.middle=c(1,1,1,0), ttd=c(0,0,0,0),maternal_educ=c(10,10,10,10), IHME_id_gdppc=c(log(5000),log(8000),log(8000),log(15000)), hiv_prev=c(.005,.005,.005,.005), cluster=c("One Transition, Middle Income","One Transition, Middle Income","One Transition, Middle Income","Democracy, High …


1
バグでベイジアン混合効果モデルを指定する方法
私はこれを週の初めに投稿し、人々の時間を無駄にしたくない、良い情報源を見つけたときに質問を撤回しました。残念ながら、あまり進歩していません。ここで善良な市民になろうとすることで、問題をできるだけ明確にします。テイカーは少ないと思います。 RIにBUGSまたはRで分析したいデータフレームがあります。これは長い形式です。これは、120人の複数の観測値からなり、合計885行です。カテゴリカルな結果の発生について調査していますが、ここではあまり関係ありません。問題は、より深いものについてです。 ここまで使ってきたモデルは mymodel<-gee(Category ~ Predictor 1 + Predictor 2..family=binomial(link="logit"), data=mydata, id=Person) 限界モデルは基本的に患者のクラスタリングを説明します。次に調べた mymodel<-gee(Category ~ Predictor 1 + Predictor 2.. , family=binomial(link="logit"), corstr = "AR-M", data=mydata, id=Person) 個々の人々の観察の時間順を説明するため。 これはあまり変わりませんでした。 次に、次の一連のMCMCPackコマンドを使用してモデル化を試みました。 mymodel<-MCMCglmm(category~ Predictor1 + Predictor2.., data=mydata, family=binomial(link="logit")) 出力の調査はスリル満点で、多くの予測因子に統計的有意性を示しました。私は、患者の中の反復測定を考慮に入れていなかったことに気づくまで、新しく改宗したベイズ人として自分を称賛しました。 私はそれを説明しなければならないことを理解しています。これは、各個人にハイパープライアを適合させることを意味する可能性があることを理解しています-それは正しいですか?バグではこれはどのような形になりますか? 基本的なログ登録モデルは次のとおりです:(kudos to Kruschke、J.、Indiana) model { for( i in 1 : nData ) …

1
平均の平均(平均の、平均の…)
次の細胞生物学実験を考えてみましょう。比較していますTTT培養細胞の異なる処理。各治療ttt変数によってインデックス付けされたいくつかの(マイクロタイター)ウェルで複製されますW ∈ { 1 、2 、⋯ 、W}w∈{1、2、⋯、W}w \in \{1, 2, \cdots, W\}。治療に対する反応をよく測定するにはwww、 の合計 FwFwF_w重複しない顕微鏡写真、またはフィールドが記録されます。次に、フィールドごとにfff よく www、 の合計 Cw fCwfC_{wf} セルは計算により識別され、これにより各セルは ccc (よく www、フィールド fff)は、 Pw fcPwfcP_{wfc}ピクセル。最後に、各ピクセルに関連付けppp 測定です バツw fc pバツwfcpx_{wfcp} (そのピクセルで記録されたさまざまな蛍光信号の強度から派生)。 問題は、すべてのピクセル測定値を集計することです バツw fc pバツwfcpx_{wfcp} 「合理的な手段」を生み出す バツtバツtX_t 治療効果の ttt それで処理された細胞と同様に「広がり」のいくつかの測定 バツtバツtX_t。 このような問題に対する標準的なアプローチは、平均を「メジャー」として使用し、分散(または標準偏差)を「スプレッド」として使用することです。ただし、この場合は、平均と分散を計算する方法が複数あり、同等ではありません。 今のところ手段に焦点を合わせると、極端な場合、単に バツw fc pバツwfcpx_{wfcp} すべてのピクセルにわたって(セル、フィールド、ウェルの分布を無視して)、この合計をピクセルの総数で割ります PPP (治療用 ttt): …

1
集約された調査データにおける加重相関の使用について
統合した2つの調査のデータを分析しています。 2005-06年および2007-08年の学校職員調査 2005-06年から2008-09年までの学生の調査 これらの両方のデータセットについて、3つの異なる学区からの観察(学生またはスタッフレベル)があり、それぞれがそれぞれの学区内の代表的なサンプルを毎年持っています。 分析のために、学生のデータを2つの2年間(2005年7月と2007年9月)に結合しました。次に、各データセットを「ドプライ」して、カットオフに従って質問に回答したスタッフまたは学生の割合を取得しました(たとえば、肯定的に答えた、「同意した」、または学生がアルコールを使用したとマークしたかどうかなど)。等。)。したがって、スタッフレベルと学生レベルのデータセットを一緒にマージすると、学校が分析の単位となり、2年間の期間に学校ごとに1つの観測しか得られません(学校に特定の期間のデータが欠落していなかった場合) )。 私の目標は、スタッフと学生の反応の関係を推定することです。これまでのところ、私の計画は、各学区のすべての変数(すべてパーセンテージを表す連続応答であるため)間のピアソン相関係数を取得することでした(これにより、このデータセット内の他の学区の一般化可能性の仮定が排除されるため)。 。これを行うには、とにかく2年間の地区データを平均して、学校ごとに1つの観測値のみを取得します。 質問: これは適切な分析計画ですか?私がより良い推論または力を提供できる他の方法を使用できますか? 私の計画が適切である場合、学校の登録に基づいて加重相関を取得する必要がありますか(相関係数に不釣り合いに寄与している大学校よりも小学校が多いため)。 私はこれについてデータ管理者に尋ねましたが、私のデータに重みを付ける必要性を決定する主な要因は、学校の規模が相関の程度に影響を与えるかどうか、そして私の解釈が学生レベルか学校レベルのどちらになるかであると述べました。私の解釈は学校レベルになると思います(たとえば、「この方法で答えるスタッフの割合がこの学校は、この方法で答える生徒のこの割合と相関しています...」)。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.