カテゴリー独立変数と連続従属変数の回帰


20

私は、独立変数が常に数値である回帰問題に常に取り組んでいることに気付きました。すべての独立変数がカテゴリカルである場合、線形回帰を使用できますか?

回答:


23

いくつかのセマンティクスと明確にするために:

  • 従属変数==結果== " "のような回帰式中 、Y = β 0 + β 1 X 1 + β 2 X 2 + + β K X Kyy=β0+β1x1+β2x2+...+βkxk
  • 独立変数==予測== "のいずれかののような回帰式における" Y = β 0 + β 1 X 1 + β 2 X 2 + + β K X Kxky=β0+β1x1+β2x2+...+βkxk

そのため、ほとんどの場合、回帰のタイプは、依存変数、結果変数、または「」変数のタイプに依存しますy。たとえば、従属変数が連続の場合は線形回帰が、従属が2つのカテゴリーのカテゴリーの場合はロジスティック回帰が、従属が2つ以上のカテゴリーの場合は多項(n)al回帰が使用されます。予測子は何でもかまいません(名義または順序カテゴリ、または連続、または混合)

(以下の発言は冗長かもしれませんが、とにかく追加します)

ただし、ほとんどのソフトウェアでは、カテゴリカル予測子をバイナリ数値システムに再コーディングする必要があることに注意してください。これは、女性の場合はセックスを0、男性の場合は1に、またはその逆にセックスをコーディングすることを意味します。3つ以上のレベルを持つカテゴリ変数の場合、これらをダミー変数に再コーディングする必要があります。Lはレベルの数であり、これらのダミーは対応するカテゴリにあるときに0または1を含みます。このように、各個人(サンプル)は、彼/彼女が属するダミー変数に1を、他の人に0を、または参照グループに属するすべてのダミーに0を使用して表す必要があります。L1L


ありがとう。質問のタイトルに書いているように、従属変数は連続的です。したがって、私はあなたの答えを「ダミーのエンコーディングを行うことを条件に、線形回帰を使用できます」と考えます。間違っている場合は修正してください。
ファマルガー

はい、そうです。
IWS

2
質問を編集して2番目の質問を追加し、同様の質問をここstats.stackexchange.com/questions/267137/…に投稿したことがわかります。さらに、予測を平滑化することの意味、または離散値を予測することの意味を尋ねます。私の知る限り、線形回帰では、予測変数に基づいた連続従属の平均値が得られます(回帰式を使用)。手の込んだしてください
IWS

1
nxiny

1
順序変数の場合、常にダミー変数を使用せず、変数を数値バージョンとして入力することで、それが連続予測子であるかのように使用するのに「十分に連続的」であると仮定することができます。ただし、これを行い、レベルが数個しかない場合は、数個のポイントのみで直線を近似します(したがって、直線性を仮定します)(ここでレベルの量が重要であることに注意してください)。リッカート尺度は、このように使用される変数の良い例であり、残念ながらさまざまな場面で問題を引き起こします。
IWS
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.