変更スコアに対する独立変数の効果をテストするときに、ベースライン測定値を制御変数として含めることは有効ですか?


38

OLS回帰を実行しようとしています。

  • DV:1年にわたる重量の変化(初期重量-終了重量)

  • IV:運動するかどうか。

しかし、体重の多い人は、thinnerせた人よりも運動単位あたりの体重が減るのが妥当と思われます。したがって、制御変数を含めたかったのです。

  • CV:初期開始重量。

ただし、従属変数ANDを制御変数として計算するために両方で初期重みが使用されるようになりました。

これでいいですか?これはOLSの前提に違反しますか?


4
治療はランダムに割り当てられましたか?
アンディW

1
最近、非常によく似た別のstats.stackexchange.com/q/15104/1036も尋ねられたことに注意してください。その質問に対する答えは、この質問に適用されます(実際、それらは重複した質問だと思います)。
アンディW

3
@Andy実際には、2つの質問は十分に異なっているので、私はこの質問に対して他の質問とは異なる答えをします。チャーリーはすでにここで素晴らしい分析を行っています。
whuber

3
通常、差分スコアを使用すると信頼性が大幅に低下することに注意してください。ただし、これは多少議論されています
-Behacad

回答:


25

「変化スコアに対する独立変数の効果をテストするときに、ベースライン測定値を制御変数として含めることは有効ですか?」という文字通りの質問に答えるには、答えはnoです。答えは「いいえ」です。変更スコアを従属変数として使用すると、構築によりベースラインスコアがエラー項と相関するため、変更スコアに対するベースラインの推定効果は解釈不能です。

を使用して

  • Y1初期重量として
  • Y2エンド・重量など
  • Δ Y = Y 2 - Y 1ΔY重量の変化としての(つまり)ΔY=Y2Y1
  • Tランダムに割り当てられた治療としての
  • X体重に影響する他の外因性因子としての(例:結果に関連するが、ランダムな割り当てによる治療とは無相関である他の制御変数)

とを回帰するモデルがあります; T XΔYTX

ΔY=β1T+β2X+e

定義によりこれは同等です。

Y2Y1=β1T+β2X+e

ここで、ベースラインを共変量として含めると、方程式の両側に項があるという問題が発生するはずです。これは、が本質的にエラー項と相関しているため、解釈できないことを示しています。β 3 Y 1Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

今、様々な答えでは混乱の一部は、異なるモデルがために同じ結果が得られるという事実に由来すると思われる治療効果、私の上記の処方で。したがって、従属変数として変化スコアを使用するモデルの治療効果を「レベル」を使用するモデルと比較する場合(各モデルは共変量としてベースラインを含む)、治療効果の解釈は次のようになります。同じ。続く2つのモデルでは同じであり、それらに基づいた推論も同じです(Bruce Weaverには、同等性を示すSPSSコードが投稿されています)。Y 1 β 1 Tβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

だから、議論する人もいます(Felixがこのスレッドで行っているように、Bruce WeaverがSPSS googleグループに関するいくつかの議論で行ったように))モデルは同じ推定治療効果をもたらすため、どちらを選択しても問題ありません。変更スコアモデルのベースライン共変量は解釈できないため、共変量としてベースラインを含めるべきではありません(推定される治療効果が同じかどうかに関係なく)。そこで、これは別の質問を提起します。変化スコアを従属変数として使用することのポイントは何ですか?フェリックスも既に述べたように、ベースラインを共変量として除外する従属変数として変化スコアを使用するモデルは、レベルを使用するモデルとは異なります。明確にするために、後続のモデルは異なる治療効果をもたらします(特に治療がベースラインと相関している場合)。

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

これは、以前の文献では「主のパラドックス」として注目されています。どのモデルが正しいのでしょうか?さて、ランダム化された実験の場合、レベルモデルが望ましいと言えます(ただし、ランダム化をうまく行えば、平均的な治療効果はモデル間で非常に近いはずです)。他の人はレベルモデルが望ましい理由を指摘していますが、チャーリーの答えは、レベルモデルのベースラインとの相互作用効果を推定できるという点で優れています(ただし、変更スコアモデルではできません)。非常によく似た質問に対するこの回答の Whuberは、変化スコアが異なる治療間の相関をどのように誘導するかを示しています。

治療がランダムに割り当てられていない状況では、変化スコアを従属変数として使用するモデルをさらに考慮する必要があります。変更スコアモデルの主な利点は、結果の時間不変予測変数が制御されることです。したがって、上記の定式化では、は時間を通じて一定であり(たとえば、特定の体重になる遺伝的素因など)、は個人が運動を選択するかどうかと相関します(は観察されません)。その場合、変更スコアモデルが望ましいです。また、治療への選択がベースライン値と相関している場合、変化スコアモデルが好ましい場合があります。ポールアリソンの論文で、XXX回帰分析の従属変数としてのスコアの変更では、これらと同じ例を示しています(トピックに関する私の見解に大きく影響したため、読むことを強くお勧めします)。

これは、ランダム化されていない設定では変更スコアが常に望ましいと言っているわけではありません。ベースラインがポストウェイトに実際の因果効果をもたらすと予想される場合は、レベルモデルを使用する必要があります。ベースラインに因果効果があると予想され、治療への選択がベースラインと相関している場合、治療効果はベースライン効果と混同されます。

重みの対数を従属変数として使用できるというチャーリーのメモを無視しました。私はそれが可能性を秘めているとは思いませんが、最初の質問には多少非公平です。別の質問では、変数の対数を使用するのが適切な場合について説明しました(そして、この場合にも適用されます)。ログに記録された体重を使用することも同様に適切であるかどうかについてあなたをガイドするのに役立つ主題に関するおそらく以前の文献があります。


引用

Allison、Paul D.1990。スコアを回帰分析の従属変数として変更します社会学的方法論 20:93-114。公開PDFバージョン


3
方程式、標準的な方法であるように、すべての共変量がランダム変数ではないと仮定すると、はと相関しません。したがって、私はあなたが表示する場合にのみ問題があると思い使用すると、モデル化する必要があり、その場合(再度、ちょうど私の意見)に、ランダムとして共同ではなくなし共変量として。この点で、データが欠落していないため、このアプローチはが固定共変量であることに相当することがわかりました(このための参照をいくつか見つけてみます)。Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1
ダンダー

1
@dandar、その文は私には意味がありません。そのノートの前処理値である結果、それは実験で操作される変数ではありません。のベースライン値がある場合、実験を実施し、を測定する場合、実験的介入の関数としてと両方をモデル化する必要があると言っていますか?Y1Y1Y2Y1Y2
アンディW

1
私が話しているモデルは確かにが治療の関数であることを意味しますが、ランダム化にもかかわらず、ベースライン平均に関して治療群と対照群の間に常にわずかな違いがあるという観点からのみです。したがって、は、この違いと治療の効果をキャプチャします。これに関する参考文献は、「Zeger and Liangによる「前後の設計の連続的および離散的応答の縦断的データ分析」、2000年)です。Y1β1
dandar

1
この論文の明確な議論は、「ベースラインは臨床試験のベースラインからの変化の分析における共変量または従属変数であるべきか?」、Liu、Mogg、Mallick、Mehrotra 2009による。彼らは、このモデルを無条件モデルと呼んでいます(つまり、ベースライン応答を条件としない)。Liu(2009)の論文では、Zeger(2000)の論文の主な結果について議論しています。これらはない欠落データとの点推定値ことがまずある無条件モデルからポストベースラインを用いてANCOVAの条件アプローチからのものと同じであるB1
dandar

1
応答としての測定、および固定ベースライン値での条件付け、および2番目に、ANCOVAモデルからのポイント推定分散が常に無条件モデルからの分散以上であること。グループ間のベースライン平均応答が小さいことを保証するランダム化により、この分散の差は通常小さいことが判明しています。著者らは、無条件モデルはランダム変数としてのベースラインのモデリングに適していると結論付けていますが、ANCOVAは修正されたものとして表示するのに適しています。
ダンダー

21

アンディの答えは、経済学者の物事の見方のようです。臨床試験では、ほとんどの場合、応答変数のベースラインバージョンを調整して、出力を大幅に増加させることが受け入れられています。ベースライン変数を条件とするため、それらを全体のエラー用語と混同する「エラー用語」はありません。唯一の問題は、ベースライン共変量の測定誤差が別のXと混同され、他のXの効果が歪められる場合です。全体として好ましい方法は、変化を計算するのではなく、ベースラインを調整し、応答変数をモデル化することです。この理由の1つは、変更がYの変換を正しく行うことに大きく依存しており、その変更が回帰モデル一般に適用されないことです。たとえば、Yが順序であれば、2つの順序変数の差は順序ではなくなります。


1
私はこの答えを完全に理解していません。「ベースラインの調整」とはどういう意味ですか?違いを取るか、それをコントロールしますか?
ヘンリック

3
「ベースラインの調整」とは、ベースラインを共変量として含めることを意味しました。変更スコアを使用することも一般的ですが、共変量としてベースラインを調整することなく変更スコアを使用することはできません(そのため、変更スコアに悩まされるのはなぜですか?)。
フランクハレル

6
実際、ここで(またはFelixのコメントに応じて)あなたが言うことは、私が言うことと直接対立するものはありません。変更スコアを使用しても「ベースラインに合わせて調整」されることはなく、不変の省略された変数を制御します(または治療への選択がベースラインと高度に相関する場合)。ベースラインが無視できない(つまり、結果に直接的な因果関係がある、または治療と相互作用する)場合、変化スコアは問題を解決しません。
アンディW

2
@Frank Harrellこの議論に参加し、これを明確にしてくれてありがとう。(+1)
ヘンリック

8

@ocramの推論を少し変更して、

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

したがって、これが正しいモデルである場合、差は重みに依存すると言うことは、最終値が初期値に依存し、係数が何であってもよいことを意味します。上の差異の回帰を実行しておよびまたは同じ変数の端重量はあなたにすべてのものが、上の同じ係数与えるべきである。しかし、このモデルが正確に正しくない場合、これらの回帰は他の係数にも異なる結果を与えます。xw0w0

この設定は、開始時の体重が治療影響ではなく、体重のを予測することを意味することに注意してください。これには相互作用項、おそらく

E[w1w0X,w0]=β0+(xw0)β+w0γ.

別のアプローチは、を計算すること ここで、は重量の成長率です。これがあなたの結果かもしれません。係数は、これらの予測変数が重量の割合の変化にどのように関連するかを示します。これは、たとえば、体重が130ポンドの人の体重を10%減らす運動係数(0.1に100を掛けた係数)によって体重が13ポンド減るのに対し、プログラムは20ポンドずつ200ポンドの参加者の体重。この場合、右側に初期重量(またはそのログ)を含める必要はないかもしれません。rx

log(w1)log(w0)r;
rx

プログラムの影響が開始時の体重に依存すると考えられる場合、相互作用用語が必要になる場合があります。作用項でを使用すると、プログラムは体重の成長率の変更に関連付けられます。プログラムの開始時の体重が1ポンド増えるに、成長率の変化が増加します(これは、治療と開始体重の両方に関する期待値のクロス部分微分です)。W 0 β 1 β 1w0w0β1β1

相互作用用語でを使用すると、プログラムの影響は、プログラムの開始時に参加者が1ポンドごとにずつ増加します。β 1 / wは0log(w0)β1/w0

ご覧のように、インタラクション用語のクロスパーシャルは解釈するのが少し難しい場合がありますが、興味のある影響を捉えることができます。


こんにちはチャーリー、私は割合の変更を使用する利点があると思いますが、なぜw1をw0で除算するのではなく、ログに記録された変数の違いを見つけるのですか?
ChrisStata

私は比例変化のアイデアが好きです。ただし、予想される相互作用が文字通り比例するかどうかは疑問のままです。そうでない場合でも、初期変数を共変量として含める必要があります。または、100ポンドまたは200ポンドの人の体重の10%を失うことも同じ難易度であると確信しますか?
ヘンリック

@ChrisStata、あなたもそれをすることができます。私はエコノミストであり、私たちはログを愛しています(また、差異化も)。各人(パネルデータセットの作成)の時系列(つまり、複数の観測)がある場合、私の方法の方が良いと主張できますが、ここでは関係ありません。ヘンリック、あなたは正しい。それについて少し答えに追加しました。
チャーリー

8

編集:Andy Wの議論はモデルCを落とすように私を説得しました。別の可能性を追加しました:ランダム係数モデル(別名マルチレベルモデルまたは混合効果モデル)による変更の分析

差分スコアの使用については多くの科学的な議論がありました。私のお気に入りのテキストは、ロゴサ(1982、[1])とフィッツモーリス、レアード、ウェア(2004、[2])です。

一般に、データを分析するには次の3つの可能性があります。

  • A)個人差のスコア(変化スコア)のみを取得する
  • B)ポスト測定をDVとして扱い、ベースラインのために制御する
  • C)差分スコアをDVとして取得し、ベースライン(それはあなたが提案したモデルです)で制御します。Andy Wの議論のため、私はこの代替案を落としました
  • D)マルチレベル/混合効果モデルのアプローチを使用して、各参加者の回帰直線がモデル化され、参加者はレベル2ユニットとして扱われます。

モデルAとモデルBは、ベースラインが変化スコアと相関している場合(例:重い人ほど減量が多い)、および/または治療の割り当てがベースラインと相関している場合、非常に異なる結果を生成できます。

これらの問題について詳しく知りたい場合は、引用された論文またはこちらこちらをご覧ください

AまたはBが望ましい条件を経験的に比較する最近のシミュレーション研究[3]もあります。

欠損値のない完全にバランスの取れた設計の場合、モデルDはモデルAと同等である必要があります。ただし、個人間のばらつきに関する詳細情報を提供し、より多くの測定ポイントに簡単に拡張でき、不均衡なデータが存在する場合でも優れた特性を備えていますおよび/または欠損値。

一番下の行として:あなたの場合、ベースライン(モデルB)に制御された事後測定値を分析します。

[1] Rogosa、D.、Brandt、D.、およびZimowski、M.(1982)。変化を測定するための成長曲線アプローチ。Psychological Bulletin、92、726-748。

[2]フィッツモーリス、GM、レアード、NM、ウェア、JH(2004)。縦断的分析の適用。ニュージャージー州ホーボーケン:ワイリー。

[3] Petscher、Y.、&Schatschneider、C.、2011.無作為化実験計画における単純な差および共分散調整スコアのパフォーマンスに関するシミュレーション研究。Journal of Educational Measurement、48、31-43。


私はこの答えを否定しましたが、共変量としてのベースラインでの変化スコアを行うべきではないと考える理由に対する私の回答を見ることができます。まとめると、製剤のモデルBとCは同等の治療効果をもたらしますが、モデルCが好ましいという意味ではありません。実際、モデルCのベースライン効果は解釈できないため、使用すべきではないと主張します。
アンディW

@AndyW:あなたの議論は私を納得させました。治療効果の最も適切な推定値は両方のモデルで同じですが、モデルBはモデルCよりも優先されるはずです。それに応じて回答を調整しました。しかしLaird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.、BとCの同等性を示すのは誰ですか?
フェリックスS

私が言ったことは、レアードの記事と矛盾しているとは思わない。基本的に私の暴言はすべて(レアードの表記では)は解釈できないので、なぜそれを報告するのかということです(同等性は問題ではありませんでした)。Lairdは、ベースラインの共変量効果が、個々の治療グループが変わらない場合の仮説としてどのように解釈されるかについて、他のコメントを行っています(それでもなお重要です)。が役立つ状況で、私の論点に気軽に反論してください(回帰係数を解釈する通常の方法では役に立たないでしょう)。ˉ Bb¯b¯
アンディW

モデルDの1つのポイント。なぜモデルDだけを考慮しないのか疑問です。これは最も一貫性があり(ベースライン値はランダム変数であり、従属変数に強制されません)、シンプルで非常に柔軟です(相互作用が可能です)追加されます)、母集団の標準偏差も提供します。
ジョルダーノ


3

グリモア等。(2005)変更スコアの分析時にベースライン調整を使用して対処。健康状態の変化がベースライン評価に先行する場合、または従属変数に大きな測定誤差がある場合、従属変数として変化スコアを使用する回帰モデルにベースライン共変量が含まれる場合、バイアスが発生することがあります。フランクハレルの答え「唯一の問題は、ベースラインの共変量の測定誤差が別のXと混同され、他のXの効果が歪められる場合です。」Glymourが扱うのと同じバイアスを反映している可能性があります。

Glymour(2005)「ベースライン調整は、変化の分析にいつ役立つのか?教育と認知変化の例。American Journal of Epidemiology 162:267-278


1

Ocramは正しくありません。重みの違いは、初期の重みを考慮しませ。具体的には、初期重量は、最終重量を減算することで取得されます。

したがって、初期の重みを制御する場合、仮定に違反しないと主張します。

(BMIと最初のBMIの差を取る場合、同じロジックが適用されます。)



Andy Wの評論家の後の更新は、私が正しいとOcramが間違っている理由(少なくとも私の観点から)でより正式にさせてくれました。

各人が持っている絶対的な体重レベルがあります(たとえば、200ポンドではなく約100ポンド)。してみましょうこのabsoulte重量こと。 次に、初期重みをとして形式化し、終了重みをとして形式化できます。aw
iw=awew=aw+Δw

したがって、OPが使用するdvはΔw=iwew=awaw+Δw=Δw

言い換えれば、重みの絶対レベル(として定式化された)はdvを表す方程式から脱落するため、dvを汚染しません(Andy Wの主張に反します)。aw

これを考慮したい場合は、それをモデルに個別に(通常のパラメーターとして、および/または相互作用項として)組み込む必要があります。

明らかにこの同じロジックはにも適用され、たとえば次のような比率に簡単に対応できますΔBMJew=awpropΔw


違いが初期の重みを考慮に入れていると言ったとき、これは私が実際に意味したことです。さて、具体的には、何を書きますか?最終重量-初期重量= ...?
ocram

私が書いたように、あなたの議論は私には間違っているようです。私はdiffeenceが故に、いくつかの、エンド重みとして(「再スケーリング」であるが、それは、同一の「スケール」であるように、実際にエンド重量がよりアカウントに初期重量がかかるという主張絶対値がanoherから減算されるabsoulte値。
ヘンリック

(-1)これは正しくありません。一般的に、方程式の右辺と左辺の両方に同じ変数を含めるべきではありません(独立変数が誤差項と相関するため)。したがって、従属変数に違いを使用する場合は、ベースラインを共変量として含めないでください。
アンディW

@アンディW:あなたの議論は原則的に正しいことを知っています。しかし、私の議論は、(ベースラインで終了値を差し引くことで)絶対値を部分的に除外することで、この相関関係を排除することです。したがって、それを共変量として追加しても、そのようなスプリアスエラー相関は生じません。
ヘンリック

@Henrik、この質問に対する私の回答と、この感情が間違っているとまだ信じている理由をご覧ください。
アンディW

0

それを観察する

end weightinitial weightY=β0+βTx

に等しい

end weight=initial weight+β0+βTx

言い換えれば、DVが初期重量をすでに考慮しているので、重量の変化を(最終重量自体の代わりに)使用します。


1
しかし、トレーニングを行うと、初期体重と減量の間に相互作用がある可能性があります。身長1,90m、体重70kgの大人と、身長1,60m、体重90kgの大人が同じトレーニング演習に参加するとします。私は後者がより多くの重量を失うと確信しています。考え直して:多分ボディマス指数は単なる体重よりも優れたCVです。
xmjx

1
@xmjx:あなたは、初期重量は最終重量に影響を与えると考えられる場合-あなたはおそらく正しいです-それがここで行われているように、モデルにオフセットとしてそれを導入することをお勧めです...
ocram

3
一般的には正しくありません。ベースライン重量の勾配が1.0でない場合、初期重量が両方のモデルにあり、通常の回帰を使用していない限り、変化の分析は最終重量の分析と同等ではありません。ベースラインの重みが2か所にある場合、モデルの説明は実際にはより困難であるため、このアプローチを維持する理由は不明です。
フランクハレル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.