回帰の当てはめに直交多項式を使用しない理由はありますか?


13

一般に、高次変数で回帰を近似するときに直交多項式を使用しない方が良いのではないかと思っています。特に、Rの使用には疑問があります。

場合poly()raw = FALSE同じ近似値を生成するpoly()raw = TRUE、とpolyしてraw = FALSE解く多項式回帰に関連する問題のいくつかは、その後べきpoly()raw = FALSE 常に多項式回帰を当てはめるために使用すること?どのような状況で使用しない方が良いでしょうpoly()か?

回答:


16

エヴァー理由は?承知しました; おそらくいくつか。

たとえば、生の係数の値に興味がある場合(仮説の値と比較する場合など)、共線性は特定の問題ではありません。通常の線形回帰(線形直交多項式)の中心を意味しないことが多いのとほぼ同じ理由です。

それらは、直交多項式を介して処理できないものではありません。利便性の問題ですが、利便性は私が多くのことをする大きな理由です。

とは言っても、多くの場合、多項式をあてはめながら直交多項式を使用します。それらには明確な利点があるからです。


直交多項式回帰の結果の係数を仮説値と比較することは可能ですか?
user2374133 14年

2
はい。たとえば、「生の」多項式からの暗黙の係数と標準誤差に変換できます。
Glen_b -Reinstateモニカ

2
多くの場合、直交多項式基底から単項基底への変換は悪条件のプロセスです(高次の場合、低次の変換はそれほど悪くありません)。したがって、単項基底係数にアプリオリに関心がある場合、直交多項式を使用して得られた数値安定性は、変換時にウィンドウから除外されるため、最初に単項式を使用することもできます。もちろん、利用者に注意してください
JMは統計学者ではありません

1
@JMありがとう、それは素晴らしい点です。幸いなことに、最近の統計アプリケーションでは、かなり低次の多項式以上に適合することは非常にまれです(私の通常のアドバイスは、3次または4次を超える強い理論的理由がない限り、異なるアプローチを検討することです-どの代替状況によっては最適かもしれませんが、たとえばスプラインのようなものはいくつかの状況に適しているかもしれません。)
Glen_b -Reinstateモニカ

13

モデルが成長したときにRを離れる場合は、そのセンタリング定数と正規化定数をパックすることを忘れないでください。そして、モデルを常に動かす必要があります。ある日、SQLにハードコーディングされていることを想像してみてください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.