SPSSの多重回帰に関する複数の代入の質問


9

現在、帰属データを使用して重回帰モデルを実行していますが、いくつか質問があります。

バックグラウンド:

SPSS 18の使用。私のデータはMARのようです。ケースのリストごとの削除では、92ケースのみが残り、複数の代入は分析のために153ケースを残します。すべての仮定が満たされました-1つの変数ログが変換されました。9 IVのカテゴリ5〜5、3スケール、1間隔。DVスケール。標準の重回帰のEnterメソッドを使用します。

  • 私のDVは、事前スコアと事後スコアメジャー間のスコアの差です。これらの変数の両方に多くのケースがありません-これらのそれぞれに欠損値を代入してから、それらの違いを計算して私のDVを計算します(これを行うにはどうすればよいですか)、またはDVのデータを代入するだけですか?最も適切なアプローチはどれですか?
  • 変換されたデータまたは変換されていない変換されたデータに対して補完を実行する必要がありますか?
  • データが欠落していない場合でも、すべての変数を代入プロセスに入力する必要がありますか、それとも10%以上のケースで欠落している変数のデータを代入する必要がありますか?

リストワイズで削除されたケースとDVの分散がほとんどないIVのアカウントで回帰を実行しました。その後、複数の代入を行った後、完全なファイルで回帰を実行しました-結果は非常に似ていますが、9つのIVはまだ私のDVの分散の約12%のみを予測しますが、私のIVの1つは、それが重要な貢献をしていることを示しています(これはたまたまログ変換された変数です)...

  • 結論にほとんど違いがない場合、つまり、IVがdvを十分に予測できない場合、または完全なデータを報告する場合、元のデータを報告する必要がありますか?

SPSSの「スケール」とはどういう意味ですか、それは序数データを指しますか?
gung-モニカの復活

SPSS形式のスケールは通常、「間隔/比率」の測定値を意味します。VARIABLELEVELコマンドを参照してください。しかし、それでは、3スケールと1間隔の質問の違いは何かという疑問が残ります。これはあなたの質問に効果的に取り組むのに十分な情報であるはずですが言われています。
アンディW

2
私が与えることができる唯一のアドバイスは、変更スコアを予測することはレベルを予測することよりもはるかに難しい傾向があるということです(そのため、多くの状況で低R^2が発生することは驚くことではありません)。ここでプレポスト設計のいくつかの素晴らしい議論を見てください。それでも完全にあなたの質問に答えることはできませんが!
アンディW

回答:


2
  1. 事前スコアと事後スコアの両方、または差異スコアを代入する必要があるかどうかは、事後差異の分析方法によって異なります。差分スコアの分析には正当な制限があることを認識しておく必要があります(優れたレビューについては、Edwards、1994を参照)。また、事前スコアを制御した後、事後スコアの残差を分析する回帰アプローチの方が優れている場合があります。その場合、分析前のスコアと分析後のスコアを補完する必要があります。これらは分析モデルに含まれる変数だからです。ただし、差分スコアの分析に専念している場合は、すべての補完されたデータセットの差分スコアを手動で計算することはほとんどないため、差分スコアを代入します。つまり、実際の分析モデルで使用している変数はすべて、
  2. 繰り返しますが、分析モデルで使用されるのは変換された変数です。
  3. 代入モデルに変数を追加すると、代入プロセスの計算上の要求が増加しますが、時間がある場合は、より多くの情報が常に優れています。完全なデータを持つ変数は、MARの欠落を説明するための非常に有用な補助変数になる可能性があります。すべての変数を使用すると、代入モデルに時間/計算の負荷がかかりすぎる場合(つまり、大きなデータセットがある場合)、各変数の各ケースの欠落に対してダミー変数を作成し、ロジスティックでこれらの欠落変数を予測する完全な変数を確認します。モデル-次に、補完モデルに特定の完全なケース変数を含めます。
  4. 元の(リストごとに削除された)分析は報告しません。欠落メカニズムがMARである場合、MIはパワーを向上させるだけでなく、より正確な見積もりも提供します(Enders、2010年)。したがって、MIによる有意な影響は、リストごとの削除ではそれほど重要ではない可能性があります。これは、その分析が不十分であるか、偏っているか、またはその両方であるためです。

参考文献

エドワーズ、JR(1994)。差異スコアの代替としての回帰分析。経営誌20、683から689まで。

エンダース、CK(2010)。応用ミッシングデータ分析。ニューヨーク、ニューヨーク:ギルフォードプレス。


1

私の経験では、SPSSの補完関数は、データセットの作成と結果の補完データセットの分析とプールの両方で使いやすいです。ただし、その使いやすさも欠点です。R統計ソフトウェアで同様の補完関数(たとえば、miceパッケージを参照)を見ると、はるかに多くのオプションが表示されます。一般的な多重代入の優れた説明については、Stef van BuurensのWebサイトを参照してください(マウスパッケージの使用の有無にかかわらず)。

これらの追加オプションは、上級ユーザーのみの「贅沢」な選択ではないことに注意してください。いくつかは、適切な達成するために不可欠な相性を特定の行方不明の変数の特定のモデル特定の行方不明の変数のための具体的な予測因子帰属診断 SPSSの帰属機能では使用できません、そしてより多くの、。

あなたの質問について:

  1. 事前スコアと事後スコアの補完、および欠落している差異を受動的に置き換えることは、事前スコアと事後スコアとの差と(jsakalukが回答した)差異の関係を維持したい場合に適しています。あなたの場合、これは、結果スコア/従属変数として事前スコアと事後スコアの差を、予測子/独立変数(の1つ)としてベースライン(事前スコア)を使用してモデルを構築する場合に当てはまることがあります。
  2. 欠損値を置き換えるために使用されるすべてのモデルは、その仮定に従う必要があります。つまり、連続変数を置き換えるには、線形回帰モデル(最も単純な場合)の仮定に従う必要があります。線形回帰および他のほとんどの回帰モデルの場合、予測変数は正規分布である必要はありませんが、モデルの残差はそうである必要があります!したがって、後者の場合は、いくつかの変換が必要になることがあります。
  3. jsakalukの回答を参照してください。ただし、SPSSは大量の代入を使用することに注意してください。これは、基本的に、入力されたすべての変数を使用して、欠落したケースで変数を置き換えることを意味します。欠落している変数が1つしかない場合、これは問題ありません。ただし、複数ある場合は、欠落している変数を使用して、欠落している他の変数を完成させます。これは問題ではないかもしれませんが、場合によっては、最終的な代入値にバイアスをかけるフィードバックループが作成されることがあります。置換された値を「安定化」する代わりに、代入の反復全体の傾向を探すことによってこれをチェックすることが不可欠です。
  4. これに対するjsakalukの回答に同意します。選択的な欠落が疑われるために完全なデータを「信用しない」と決め、複数の代入法を使用してこれを解決または部分的に修正する場合(実際にはバイアスが最も少ないと考えられます)、複数の代入結果が主な結果になります。公演。残念ながら、経験から、レビュー担当者やその他の関心のある人々は、完全なケース分析を見たいと思うこともあります(そのため、手元に置いておいてください)。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.