回帰分析の前提の1つは、とが絡み合っていないことです。でも考えてみると理にかなっているようです。Y
例を示します。3つのセクション(ABおよびC)のテストがある場合。全体のテストスコアは、3つのセクションの個々のスコアの合計と等しくなります。ここで、はセクションAのスコアで、は全体的なテストスコアであると言えます。次に、線形回帰はこの質問に答えることができます:セクションAに起因する全体的なテストスコアの変動性は何ですか?ここでは、いくつかのシナリオが考えられます。Y
- セクションAは3つのセクションの中で最も難しいものであり、学生は常に最も低いスコアになります。このような場合、直感的にはは低くなります。全体的なテストスコアのほとんどはBとCによって決定されるためです。
- セクションAは学生にとって非常に簡単でした。この場合も、相関は高くありません。学生は常にこのセクションの100%を採点しているため、このセクションではテスト全体の得点については何もわかりません。
- セクションAには中間的な困難があります。この場合、相関はより強くなります(ただし、他のスコア(BおよびC)にも依存します)。
別の例はこれです:尿中の微量元素の総含有量を分析します。そして、尿中のその微量元素の個々の種(化学形態)を独立して分析します。多くの化学的形態があり得る。そして、私たちの分析が正しければ、化学形態の合計は、(異なる手法で分析された)元素の総含有量と同じになるはずです。ただし、1つの化学形態が尿中の総元素含有量と相関しているかどうかを尋ねることは理にかなっています。この総含有量は、その元素の食物からの総摂取量の指標であるためです。次に、が尿の合計要素であり、Y 尿中の化学形態Aである場合、相関を調べることにより、この化学形態が全体的な変動に寄与する主要な形態であるかどうかを調べることができます。
とが独立していない場合でも理にかなっているように思われ、これが場合によっては科学的質問への回答に役立つと思われます。Y
上記の例では有用または意味があると思いますか?上記のテストスコアの例を考えると、生徒の難易度がまったく同じであれば、各セクションの約33%の貢献があると私はすでに言っています。しかし実際には、これは必ずしも真実ではありません。したがって、多分回帰分析を使用すると、試験の各セクションに起因する真の変動性を知るのに役立つと考えていました。したがって、帰無仮説が真ではないことをすでに知っていても、は意味があるように思えます。R 2
そのような状況を説明し、意味のあるパラメーターを提供するための代替の修正された回帰方法はありますか?