カテゴリー予測因子と連続予測因子が混在している場合、重回帰を使用できますか?


12

1つのカテゴリ変数にコーディングを使用できるように見えますが、2つのカテゴリ変数と1つの連続予測変数があります。SPSSでこれに重回帰を使用できますか?ありがとう!


私はあなたが確信していることができますが、私は考えてきたん怖い方法を
ワンストップ

SPSSに付属のヘルプドキュメントに回帰のようなものを入力することをお勧めします。任意の統計パッケージのパンとバターのものでなければなりません
probabilityislogic

1つのカテゴリ変数のコーディングの意味がわかりません。構文の例を挙げることができますか?従属変数は連続ですか、それともカテゴリーですか?
アンディW

回答:


8
  1. これがSPSS構文の質問の場合、答えは、適切にコーディングされたカテゴリ変数を、連続変数とともに「独立変数」の変数リストに入れるだけです。
  2. 統計上:あなたのカテゴリー変数はバイナリですか?その場合、ダミーまたはその他の有効なコントラストコードを使用する必要があります。バイナリではない場合、カテゴリ変数は順序または名義ですか?名目上の場合、再び、対照的なコード戦略を使用する必要があります。結果として、変数の各レベルが結果または「従属」変数に与える影響をモデリングします。カテゴリー変数が序数の場合、ほとんどの場合行うべき賢明なことは、連続予測変数(つまり「独立」)変数を使用する場合と同様に、モデルにそのまま入力することです。その場合、カテゴリカル予測子(「独立」)変数のレベル間の増分を仮定します。これが間違いになることはめったにありませんが、そうであれば、再びコントラストコードを使用して、各レベルの影響をモデル化する必要があります。この質問はこのフォーラムで非常に頻繁に出てきます-ここに良い分析があります
  3. 私の考えでは、欠落データの処理方法は完全に別の問題です。私の理解では、ペアワイズ削除は多変量回帰の有効なアプローチとは見なされていません。Listwiseはかなり一般的ですが、結果に偏りが生じる可能性もあり、確かに残念です。複数の代入は美しさのものです。

DMK38について質問があります。上記のように、順序変数であれば、カテゴリ変数をそのままモデルに追加してもかまいません。私はこれを読んでうれしいです;-)それについて言及している良い情報源はありますか?ご回答どうもありがとうございました!リリアン
リリアンヤンス-ベケン

1
@ LilianJans-Beken:「順序独立変数ロジスティック回帰および順序独立変数を使用した連続従属変数」を参照してください。より複雑な方法を使用したくない場合もありますが、予測変数を間隔スケールとみなしても、応答と線形関係を持つように制約する必要はないことに注意してください。そして、感じていないと仮定する義務が等しい何か他のものは、より賢明なようだ場合の隣接レベル間の間隔を。
Scortchi-モニカの復職

1
@ LilianJans-Beken:また独立変数として序カテゴリ変数処理する方法序独立変数とロジットを。ああ、Cross Validatedへようこそ!
Scortchi -復活モニカ

2

最初のカテゴリカル予測子に使用するのと同じ方法に従うことにより、間違いなく可能です。最初のそのような変数の場合と同様に、ダミー変数を作成します。しかし、多くの場合、SPSSのUnianovaコマンドを使用する方が簡単です。これは、印刷またはPDF形式の構文ガイドで調べることができます。または、分析...一般線形モデル...単変量からアクセスできます。

ただし、Regressionコマンドには少し複雑ですが、Unianovaよりも多くの利点があります。最も重要なことは、「ペアワイズ欠損」を選択できることです(1つまたは2つの予測変数の値が欠損しているからといって、ケースを失う必要はありません)。また、部分プロットや影響統計など、多くの貴重な診断を取得できます。


1
@ロランド-良い答え。とはいえ、欠落したペアワイズアプローチは、異なる数の観測に基づいているため、効果の比較を混乱させる傾向があります。心に留めておくべき何かかもしれません。
richiemorrisroe

少し混乱したペアワイズの欠落は、完全に別個のモデルを実行する場合にのみ問題になると思います(ステップワイズモデル選択手順を使用する場合など)。すべての変数をモデルに入力すると、欠損値がリストごとに削除されます。
アンディW

@ richiemorrisroe-私は同意し、心に留めておく価値があります。@ Andy W-SPSSで、強制入力のみを使用して、ペアワイズの欠落とリストワイズの欠落により、さまざまなdfを含むあらゆる点で異なる結果が得られることを確認しました。
rolando2

紛らわしいと思うのですが、SPSSが欠落データの値を構成しない限り、欠落ペアを宣言することで、どのように異なる結果セットを返すことができますか?テキストファイルdl.dropbox.com/u/3385251/SPSS_missing_Listwise_vs_Pairwise.txtに投稿したシミュレーションデータを使用した例を次に示します。回帰コマンドが欠落データを処理する方法に関するこの話はすべて混乱を招き、OPの元の質問とは関係がなく、誤解を招く可能性が高いため、現在、あなたの答えを否定しています。
アンディW

1

カテゴリ変数をSPSSのモデルで使用するダミー変数のセットに変換する簡単な方法は、do repeat構文を使用することです。これは、カテゴリ変数が数値順になっている場合に最も簡単に使用できます。

*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode. 
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute. 

それ以外の場合は、一連のifステートメントを実行してダミー変数を作成できます。私の現在のバージョン(16)には、回帰コマンドでダミー変数のセットを自動的に指定するネイティブ機能がありません(xiコマンドを使用してStataでできるように)が、これが新しいバージョンで使用可能であれば驚かないでしょう。dmk38のポイント#2にも注意してください。このコーディングスキームは、名目上のカテゴリを想定しています。変数が序数の場合、より慎重に使用できます。

dmk38にも同意します。特定の方法で欠落データを指定する機能があるため、回帰についての話は完全に別の問題です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.