回帰で他の変数を一定に保つことは(直感的に)どういう意味ですか?


9

他の変数を一定に保ちながら、個々の変数の影響をどのように決定するかについて、1)機械的な説明と2)直観的な説明の両方を探しています。

調査データを使用した例で、正確に言うとどういう意味ですか:

「年齢、性別、収入を一定に保ち、教育の効果は___」

私の理解では、回帰を使用して実験的な設定を再現しようとしています。上記の例では、年齢、性別、収入などが同じであるが、教育レベルが異なるサブ集団を比較し、それらの部分母集団の平均。質問:

  1. この直感は正しいですか?
  2. これらの部分母集団は必ず存在しますか?調査に、コントロールの値がまったく同じ回答者が含まれていない場合はどうなりますか?
  3. これらの部分母集団の推定値の不確実性はどのように決定されますか?


偏微分は「直感的」ですか?
Aksakal 2016年

回答:


5

直感はトリッキーなテーマであり、それは人の背景に依存します。例えば、私は数理物理学を勉強した後に統計学を勉強しました。私にとっての直感は偏微分です。回帰モデルを考える 通りに言い換えることができる

yi=a+bxxi+bzzi+εi
yi=f(xi,zi)+εi,
f(x,z)=bxx+bzz

関数総微分を取ります: f()

df=fxdx+fzdz

これは、偏微分の定義方法です: あなたが保持定数、及びステップから離れる。偏微分は、変化がに敏感であることを示します。ベータ(係数)は対象の変数の勾配であることがわかります: x

fx=limΔx0f(x+Δx,z)f(x,z)Δx
zxfx
fx=bx

つまり、単純な線形モデルでは、係数は変数に関する偏微分係数(勾配)です。それが私にとって「一定に保つ」とは直感的に意味します。


1
私はこの直感に感謝しますが、説明の一部は一部の人にとって予期しない問題を引き起こす可能性があります。多項式回帰の場合や相互作用が含まれる場合など、(1)カテゴリ回帰の偏微分係数を定義する方法と(2)回帰変数が他の回帰変数の関数である場合に偏微分係数を定義する方法を決定することに注意を向けます。
whuber

2
  1. 直感は根本的に正しいです。私も簡単かつ直感的な方法で答えようとします-
  2. これらの部分母集団は、(a)推測された共変量に関して被験者をサンプリングする、または(b)その変動性に制約を課すことで(つまり、分散= 0)、一定に保つために必ず存在します。これは、カテゴリー変数の場合は1つのグループ(男性のみ、ブロンドのみなど)を使用するか、特定の共変量(年齢、教育、収入など)の平均を使用することで行われます。

6
この回答は、非実験または観測データセットへの回帰のすべての可能なアプリケーションを除外しているようです(おそらく、より多くの観測で拡大できるものはまれですが)。そのため、それは不必要に制限的であるように見え、そのため、おそらく基礎となる概念を正当化しません。
whuber

2

user122677が答えたように、直感は正しいです。線形回帰では、すべての係数は、1つの変数値が1単位増加され、他のすべての変数は一定のままである場合の結果の変化量です。言い換えると、係数は、各変数に関するモデル予測の偏導関数です。

とにかく、モデルに交互作用が含まれている場合、交互作用を変更せずに変数を変更することはできないため、1つの係数のこの解釈は実際の変化として意味をなさないことに注意してください。同じことが多項式回帰でも起こり、他の項を変更しない限り項は変更できません。

これらの部分母集団の存在については、存在する必要はありません。一部の実験計画では存在する可能性がありますが、連続変数を使用した観察研究では、存在する可能性はほとんどありません。例えば:

  • バイナリ(または離散有限)変数を使用した実験の完全な計画では、変数の値のすべての組み合わせがサンプルに含まれます。
  • 連続変数を使用した観測研究では、各観測はすべての変数に対して一意の値を取得する可能性が非常に高いため、1つを除いてすべての変数が等しい2つの要素が存在することはほとんどありません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.