分散が大きい予測子は「より良い」ですか?


13

「基本統計」の概念に関する質問があります。学生として、私はこれが完全に間違っていると考えているかどうか、そしてそうである場合、その理由を知りたい:

レッツは、私が仮に離婚を「怒りの管理の問題」との関係を見て、言うことをしようとしていますと言う(はい/いいえ)ロジスティック回帰で、私は二つの異なる怒りの管理スコアを使用するオプションがある- 100の両方で
スコア1をアンケート評価ツール1と他の選択肢から得られます。スコア2は別のアンケートから得られます。仮に、怒りの管理の問題が離婚を引き起こすと以前の研究から信じる理由があります。
私の500人のサンプルで、スコア1の分散がスコア2の分散よりもはるかに高い場合、スコア1がその分散に基づいて離婚の予測子として使用するのに適したスコアであると信じる理由はありますか?

私には、これは本能的に正しいように思えますが、そうですか?


興味深い質問ですが、Wh​​uberの答えはそれを完璧に説明していると思います。質問に対する私の最初の回答は、「分散の増加は、より高い階級差別情報を必要としない」でした。
ジュバル

回答:


11

いくつかの簡単なポイント:

  • 変数に異なるスケールを採用することにより、分散を任意に増減できます。スケールに1より大きい定数を掛けると、分散は増加しますが、変数の予測力は変わりません。
  • 変動と信頼性を混同している可能性があります。他のすべてが等しい(少なくとも真のスコア予測があると仮定する)場合、コンストラクトを測定する際の信頼性を高めると、予測力が向上します。減衰補正に関するこの説明を参照してください。
  • 両方のスケールが25個の5点アイテムで構成されており、合計スコアが20から100の範囲であると仮定すると、分散が大きいバージョンの方が信頼性が高くなります(少なくとも内部整合性に関して)。
  • 内部一貫性の信頼性は、心理テストを判断するための唯一の基準ではありません。また、特定の構成に対して、あるスケールの予測力と別のスケールの予測力を区別する唯一の要素ではありません。

9

簡単な例は、何が重要かを識別するのに役立ちます。

してみましょう

Y=C+γX1+ε

ここで、γはパラメーター、X 1は最初の機器(または独立変数)のスコア、εは不偏iidエラーを表します。2番目の楽器のスコアを最初の楽器に関連付けますCγX1ε

X1=αX2+β.

X1=2X250X1α2X2

Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C+γX2+ε.

パラメーターが変化し、独立変数の分散が変化しますが、モデルの予測能力は変わりません

X1X2YYXi

X1X2YYX1X2X2


1

使用している統計検定の前提条件を常に確認してください!

ロジスティック回帰の前提条件の1つは、エラーの独立性です。つまり、データのケースを関連付けるべきではありません。例えば。怒り管理調査で行ったかもしれないと私は恐れている異なる時点で同じ人を測定することはできません。

また、2回の怒り管理調査では、基本的に同じものを測定しており、分析が多重共線性に悩まされる可能性があることも心配です。


1
N26は思考実験を提案していると思います。すなわち、スタディをデザインするときに2つのスケールから選択できる場合、一応、分散が大きいスケールを選択する必要があります。また、同じコンストラクトを表すが、異なる方法で測定される2つの予測子を持つことは、観測値の独立性の仮定に違反しません。
ジェロミーアングリム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.