なぜ遺伝的関連研究で年齢と年齢の2乗を共変量として使用するのですか?有意な共変量として識別されている場合は年齢の使用を理解できますが、年齢の2乗の使用については迷っています。
なぜ遺伝的関連研究で年齢と年齢の2乗を共変量として使用するのですか?有意な共変量として識別されている場合は年齢の使用を理解できますが、年齢の2乗の使用については迷っています。
回答:
テイラー級数近似は、ほとんどすべての滑らかな関数が多項式で近似できることを示しているため、や(xは例では年齢)のような項を含めて、既知または未知の非線形関数、またはあなたのケースでは年齢。これらの係数をテストすることは、関係が適度に線形であるかどうか、または非線形項がより良い適合を与えるかどうかをテストする簡単な方法でもあります。x 3 x
分析の最終的な目標に応じて、非線形項を予測のために保持したり、予測のプロットを使用して実際の関数関係を示唆したりできます。同様の目標を達成するために多項式項の代わりに使用できる3次スプラインなどの他のツールがありますが、2項項を追加すると、これをすばやく簡単に行うことができます。
単純さを保つ:変数の2乗を追加すると、年齢の影響をより正確にモデル化できます。これは、独立変数と非線形の関係がある場合があります。たとえば、年齢の影響は、たとえば50歳まではプラスになり、その後はマイナスになる可能性があります。
年齢の二乗を年齢に追加すると、効果がすべての年齢で線形であると仮定するのではなく、異なる年齢の効果をモデル化できます。
ステップごとの簡単なガイドと、年齢と年齢の2乗変数を解釈する方法については、私のブログ投稿を参照してください。
http://www.excel-with-data.co.uk/blog-1/how-to-regression-analysis-in-excel/
モデルの仮定を満たすために変換が行われた可能性があります。また、ある種の二次関係が存在するために行われた可能性もあります。