線形回帰の勾配を他の回帰モデルの独立変数または従属変数として使用できますか?


8

私には100人の患者がいて、各患者には10件の長期的な血清クレアチニン測定があります。推定糸球体濾過率(eGFR)は、性別、年齢、血清クレアチニンを含むMDRD式から計算されました。eGFRは従属変数であり、時間は各患者の線形回帰の独立変数です。

  1. 線形回帰は「独立したXの」仮定に違反し、代わりに線形混合モデルを使用する必要がありますか?
  2. 各患者から推定されたeGFR勾配(測定値ではなく不確実性を伴う推定値)(各患者の線形回帰または変量効果混合モデル[混合モデルで各患者の勾配を推定する方法?])は、他の回帰モデルの独立変数または従属変数?

ありがとうございました。


X(独立変数)が測定変数の場合、「固定値」ではなく「ランダム変数」です。Wikipedia(en.wikipedia.org/wiki/Random_variable)によれば、「確率と統計では、確率変数または確率変数は、おおまかに言って、ある種のランダムプロセスの測定から値が生じる変数です。」私は正しいですか?

質問に返信を使用しないでください。コメントでこの会話を続けることができます。別のオプションは、これを質問として再投稿し、ここにリンクを戻すことです。
whuber

回答:


5

実際には、線形回帰を数学的手順として使用して、10変量の観測値を単一の変数(勾配)に圧縮することを提案しています。そのため、これは、(たとえば)反復測定の平均を回帰変数として使用したり、主成分スコアを回帰に含めたりするなど、同様の手順のもう1つの例にすぎません。

特定のコメントが続きます。

(1)線形回帰では、X(独立変数)が「独立」である必要はありません。実際、標準的な定式化では、Xは確率変数の実現ではなく固定値であるため、独立性の概念は適用されません。

(2)はい、勾配を従属変数として使用できます。線形回帰では従属変数のように動作する可能性があることを確認するのに役立ちます。通常の最小二乗では、これは

a。スロープは、患者の属性によって異なります。

b。依存関係は、少なくとも観察された患者属性の範囲では、ほぼ線形です。

c。観測された勾配と仮定された勾配の間の変化はランダムであると考えることができます。

d。このランダムな変動は、(i)患者間で独立しており、(ii)患者間でほぼ同じ分布です。

e。前と同様に、独立変数はランダムではなく、固定されており、かなりの誤差なしに測定されています。

これらすべての条件がほぼ成立していれば、大丈夫です。(d)または(e)の違反は、通常の最小二乗法の一般化を使用することで解決できます。

(2 ')。勾配は不確かさを示すため(勾配の推定に使用される回帰で測定)、それらは混合モデルでランダムとして扱うか、変数のエラーモデルを使用していない限り、独立変数の適切な候補にはならない可能性があります。

また、階層ベイズモデルを使用して、この状況に対処することもできます。


「インディペンデントX's」の誤称でごめんなさい。私が意味したのは、「Xを条件とした独立Yの条件」でした。つまり、残差は独立している必要があります。この仮定は、縦断的観測では違反されています。参照:長期データのモデリング、II:標準回帰モデルと拡張。メソッドMol Biol。2009; 473:61-94。
Jinn-Yuh Guh

あなたはから、上記の「最小二乗法の一般化」についての詳細を見つけることができルイスとリンツ2005
conjugateprior
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.