マルチレベルモデルにおける切片勾配相関の効用について


8

彼らの著書「Multilevel Analysis:An Introduction to Basic and Advanced Multilevel Modeling」(1999)で、Snijders&Bosker(8章、セクション8.2、119ページ)は、切片と勾配の相関を、切片と勾配の共分散を除算して計算すると述べています。切片の分散と勾配の分散の積の平方根によって、-1と+1の間に制限されず、無限になることさえあります。

これを考えると、私はそれを信頼すべきだとは思いませんでした。しかし、私は説明するための例を持っています。人種(二分法)、固定効果としての年齢と年齢*人種、ランダム効果としてのコホート、およびランダム勾配としての人種二分法変数を含む私の分析の1つで、一連の散布図は、勾配が値全体であまり変化しないことを示しています私のクラスター(つまり、コホート)変数の変化、およびコホート全体で勾配がより少なくまたはより急になるのがわかりません。尤度比検定では、サンプルの合計サイズ(N = 22,156)にも関わらず、ランダムインターセプトモデルとランダムスロープモデル間の適合性が有意でないことも示されています。それでも、切片と傾きの相関は-0.80近くでした(これは、時間の経過に伴う、つまりコホート全体でのY変数のグループ差の強い収束を示唆しています)。

Snijders&Bosker(1999)がすでに述べていることに加えて、切片と勾配の相関を信頼しない理由を示す良い例だと思います。

マルチレベル研究で切片勾配相関を本当に信頼して報告する必要がありますか?具体的には、そのような相関関係の有用性は何ですか?

編集1:それは私の質問に答えるとは思わないが、gungは私に詳細情報を提供するように頼んだ。役立つ場合は、以下を参照してください。

データは一般社会調査からのものです。構文には、Stata 12を使用したので、次のようになります。

xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml cov(un) var
  • wordsum 語彙テストのスコア(0-10)、
  • bw1 民族変数(黒= 0、白= 1)、
  • aged1-aged9 年齢のダミー変数であり、
  • bw1aged1-bw1aged9 民族性と年齢の相互作用です
  • cohort21 は私のコホート変数です(21のカテゴリ、0〜20のコード)。

出力は次のとおりです。

    . xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml 
> cov(un) var

Performing EM optimization: 

Performing gradient-based optimization: 

Iteration 0:   log restricted-likelihood = -46809.738  
Iteration 1:   log restricted-likelihood = -46809.673  
Iteration 2:   log restricted-likelihood = -46809.673  

Computing standard errors:

Mixed-effects REML regression                   Number of obs      =     22156
Group variable: cohort21                        Number of groups   =        21

                                                Obs per group: min =       307
                                                               avg =    1055.0
                                                               max =      1728


                                                Wald chi2(17)      =   1563.31
Log restricted-likelihood = -46809.673          Prob > chi2        =    0.0000

------------------------------------------------------------------------------
     wordsum |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         bw1 |   1.295614   .1030182    12.58   0.000     1.093702    1.497526
       aged1 |  -.7546665    .139246    -5.42   0.000    -1.027584   -.4817494
       aged2 |  -.3792977   .1315739    -2.88   0.004    -.6371779   -.1214175
       aged3 |  -.1504477   .1286839    -1.17   0.242    -.4026635     .101768
       aged4 |  -.1160748   .1339034    -0.87   0.386    -.3785207    .1463711
       aged6 |  -.1653243   .1365332    -1.21   0.226    -.4329245     .102276
       aged7 |  -.2355365    .143577    -1.64   0.101    -.5169423    .0458693
       aged8 |  -.2810572   .1575993    -1.78   0.075    -.5899461    .0278318
       aged9 |  -.6922531   .1690787    -4.09   0.000    -1.023641   -.3608649
    bw1aged1 |  -.2634496   .1506558    -1.75   0.080    -.5587297    .0318304
    bw1aged2 |  -.1059969   .1427813    -0.74   0.458    -.3858431    .1738493
    bw1aged3 |  -.1189573   .1410978    -0.84   0.399     -.395504    .1575893
    bw1aged4 |    .058361   .1457749     0.40   0.689    -.2273525    .3440746
    bw1aged6 |   .1909798   .1484818     1.29   0.198    -.1000393    .4819988
    bw1aged7 |   .2117798    .154987     1.37   0.172    -.0919891    .5155486
    bw1aged8 |   .3350124    .167292     2.00   0.045     .0071262    .6628987
    bw1aged9 |   .7307429   .1758304     4.16   0.000     .3861217    1.075364
       _cons |   5.208518   .1060306    49.12   0.000     5.000702    5.416334
------------------------------------------------------------------------------

------------------------------------------------------------------------------
  Random-effects Parameters  |   Estimate   Std. Err.     [95% Conf. Interval]
-----------------------------+------------------------------------------------
cohort21: Unstructured       |
                    var(bw1) |   .0049087    .010795      .0000659    .3655149
                  var(_cons) |   .0480407   .0271812      .0158491     .145618
              cov(bw1,_cons) |  -.0119882    .015875     -.0431026    .0191262
-----------------------------+------------------------------------------------
               var(Residual) |   3.988915   .0379483      3.915227     4.06399
------------------------------------------------------------------------------
LR test vs. linear regression:       chi2(3) =    85.83   Prob > chi2 = 0.0000

Note: LR test is conservative and provided only for reference.

作成した散布図を以下に示します。9つの散布図があり、年齢変数のカテゴリごとに1つあります。

ここに画像の説明を入力してください

編集2:

. estat recovariance

Random-effects covariance matrix for level cohort21

             |       bw1      _cons 
-------------+----------------------
         bw1 |  .0049087            
       _cons | -.0119882   .0480407

追加したいことがもう1つあります。邪魔なのは、切片勾配の共分散/相関に関して、Joop J. Hox(2010、p。90)の著書「Multilevel Analysis Techniques and Applications、Second Edition」にあります。と言いました :

切片の残差と勾配の残差の間の相関として表される場合、この共分散を解釈する方が簡単です。...時間変数を除く他の予測子がないモデルでは、この相関は通常の相関として解釈できますが、モデル5および6では、モデルの予測子を条件とする部分相関です。

したがって、「相関の概念はここでは意味がない」と信じているSnijders&Bosker(1999、p。119)には、[-1、1]に限定されていないため、誰もが同意するわけではないようです。


プロットを投稿できますか?データとモデルに関する情報を追加できますか?分析の出力と、生成に使用されたコードを投稿できますか?
ガン-モニカを元に戻す

コメントありがとうございます。切片勾配の「相関」の有用性に関する私の質問には答えないと思いますが、Qを編集して、要求した情報を追加しました。とにかくそれが役に立てば幸いです。
Meng Hu

Meng Huさん、ありがとうございました。それが人々に役立つかどうかはわかりませんが、役立つかもしれませんし、害はありません。
ガン-モニカを復活

本を持っていないので、相関ではなく、傾きと切片の共分散について言ったのでしょうか。N = 22kの場合、BLUPをポストできませんが、それらの分散共分散行列をポストできますか?私はあなたがStataを使用していることを知りましたが、それは私にはわかりませんが、それは可能であるべきです。
ガン-モニカの回復

変量効果の分散共分散は、前に追加した出力に表示されているはずです。しかし、私はもう一度質問を編集しました。そうは言っても、Snijders&Bosker(1999)が切片勾配の共分散について特に何も述べなかったことは覚えていません。彼らは常にそれをランダム勾配モデルに含めるべきだと言っています。彼らはまた、そのような共分散に対して負/正の係数を持つことの意味を説明しています。しかし、それですべてだと思います。ちなみに、切片と勾配の相関は通常の相関として解釈できると信じているHox(2010)の箇所も追加しました。
Meng Hu

回答:


4

私は数週間前に数人の学者(ほぼ30人)に電子メールを送りました。メールを送信した人はほとんどいません(常に集団メール)。ユージーン・デミデンコが最初に答えた:

cov / sqrt(var1 * var2)は、解釈に関係なく常に[-1,1]内にあります。これは、切片と勾配、2つの勾配などの推定値である可能性があります。-1<= cov / sqrt(var1 * var2 )<= 1はコーシーの不等式から続き、常に真です。したがって、私はSnijders&Boskerステートメントを却下します。たぶん他のいくつかの情報が不足していますか?

その後、Thomas Snijdersからのメールが続きました。

不足している情報は、Snijders&Bosker(第2版2012)の122、123、124、129ページに実際に書かれたものです。これは、真実である可能性のある2つの競合する主張についてではなく、2つの異なる解釈についてです。

p。123二次分散関数が導入され、\ sigma_0 ^ 2 + 2 \ sigma_ {01} * x + \ sigma_1 ^ 2 * x ^ 2となり、「この式は\ sigma_0 ^という解釈なしで使用できます2と\ sigma_1 ^ 2は分散であり、\ sigma_ {01}は共分散です。これらのパラメーターは任意の数値である可能性があります。この式は、残差分散がxの2次関数であることを示しています。

pの段落全体を引用させてください。129、レベル2の2次分散関数について。\ tau_0 ^ 2と\ tau_1 ^ 2はランダム切片とランダム勾配のレベル2の分散であり、\ tau_ {01}はそれらの共分散であるという1つの可能性のある解釈ですが、これは明示的に地平線の後ろに置かれています。

「パラメータ\ tau_0 ^ 2、\ tau_1 ^ 2、および\ tau_ {01}は、前のセクションと同様に、分散および対応する共分散として解釈されません。解釈は分散関数(8.7 )[注ts:これは本では誤って8.8と報告されています]したがって、\ tau_ {01} ^ 2 <= \ tau_0 ^ 2 * \ tau_1 ^ 2である必要はありません。言い換えると、「相関」 \ tau_ {01} /(\ tau_0 * \ tau_1)によって正式に定義されている場合、相関関係の概念がここでは意味をなさないため、無限大であっても1より大きいか-1より小さい可能性があります。この例は、 \ tau_1 ^ 2 = 0であり、パラメータ\ tau_0 ^ 2および\ tau_ {01}のみが使用される線形分散関数。 "

分散関数はxの二次関数(変数 "ランダムな傾きを持つ")であり、結果の分散はこれにレベル1分散を加えたものです。これがすべてのxに対して正である限り、モデル化された分散は正です。(追加の要件は、対応する共分散行列が正定であることです。)

これのいくつかのさらなる背景は、ソフトウェアのパラメータ推定アルゴリズムの違いの存在です。一部のマルチレベル(変量効果)ソフトウェアでは、変量効果の共分散行列がすべてのレベルで正の半定値である必要があります。他のソフトウェアでは、観測データの結果として得られる推定共分散行列が正の半定値であることのみが要求されます。これは、潜在変数のランダム係数の概念が放棄され、モデルが観測データの特定の共分散構造を指定することを意味します。それ以上でもそれ以下でもありません。その場合、引用されたJoop Hoxの解釈は適用されません。Harvey Goldsteinはすでにずっと前にレベル1で線形分散関数を使用しており、レベル1のゼロ勾配分散と非ゼロ勾配切片相関によって表されていることに注意してください。これは「複雑なバリエーション」でした。たとえば、 http://www.bristol.ac.uk/media-library/sites/cmm/migrated/documents/modelling-complex-variation.pdf

そして、Joop Hoxは答えた:

ソフトウェアMLwiNでは、共分散項を推定すると同時に、分散の1つをゼロに制約することが可能です。これにより、「相関」が無限になります。そしてはい、一部のソフトウェアは負の分散などの推定を許可します(SEMソフトウェアは通常これを許可します)。だから私の発言は完全に正確ではなかった。「通常の」非構造化ランダム構造に言及しました。ランダムな勾配で変数を再スケーリングして異なるゼロ点を持つ場合、分散と共分散は一般に変化することを付け加えます。したがって、相関関係は、予測子変数に固定のゼロ点がある場合、つまり比率スケールで測定される場合にのみ解釈可能です。これは成長曲線モデルに適用され、初期状態と成長率の間の相関が時々解釈されます。その場合、値ゼロは「

そして彼は別のメールを送った:

とにかく、トムの以下の説明は、私の非公式なスタイルよりもSnijders / Boskerコラボレーションのスタイルに適していると思います。90ページに、「ランダムな部分のパラメーター値は推定値であることに注意してください。標準化された共分散を通常の相関として解釈すると、分散に制約がないこと、およびソフトウェアが負の推定を許可しないことを前提としています。ランダムな部分が構造化されていない場合、通常の(共)分散としての解釈は一般的に妥当です。

縦軸の章で相関の解釈について書いたことに注意してください。成長曲線モデリングでは、この相関を実質的な結果として解釈するのは非常に魅力的です。この値は「時間のメトリック」に依存するため危険です。興味がある場合は、Lesa HoffmanのWebサイト(http://www.lesahoffman.com/)にアクセスすることをお勧めします

したがって、変量効果に非構造化共分散を指定した私の状況では、切片勾配相関を通常の相関として解釈する必要があります。


FYI、とあなたが誰かを参照する必要があるかどうscholarresearcher自分の履歴書を見ることによって確立することができます。彼らが最初に本をリストする場合(そして査読付きのジャーナルに論文がない場合...人文科学の場合のように)、それらは間違いなくですscholars。彼らが最初に論文や助成金をリストする場合、彼らはそうresearchersです。
StasK 2015

@StasK、なぜ人文科学のジャーナルは査読されていないと言うのですか?そうだと思った。例:古典哲学中世初期ヨーロッパ -これらは、Google Scholar Metricsでランダムなキーワードを検索した最初の例です。私はさらにいくつかをチェックしましたが、それらはすべて査読済みのようです。
amoeba 2015

私は人々が査読付きのジャーナルの論文ではなく本を書くと言っただけです。人文科学の査読付きジャーナルが存在することは間違いありません。
StasK 2015

1

私は現場の人々に確認しようとするあなたの努力を称賛することができるだけです。切片と勾配の間の相関関係の有用性について少しだけコメントしたいと思います。SkrondalとRabe-Hesketh(2004)は、ランダムな勾配でモデルに入る変数のシフト/センタリングによってその相関を操作する方法の単純で愚かな例を提供しています。を参照してください。54-Amazonプレビューで「図3.1」を検索します。それは少なくとも数十の言葉の価値があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.