これはおそらくどこかで議論されたと思いますが、明確な答えを見つけることができませんでした。式を使用して線形回帰モデルのサンプル外を計算しようとしていますは残差の2乗の合計で、は2乗の合計です。トレーニングセットについては、
テストセットはどうですか?サンプル外にを使い続けるべきですか、それともを使うべきですか?
を使用すると、結果のが負になることがあります。これは、使用したsklearnの関数の説明と一致しています(サンプルをテストするためのlinear_modelの関数でも使用されます)。彼らは、「入力フィーチャを無視して、yの期待値を常に予測する定数モデルは、R ^ 2スコアが0.0になる」と述べています。r2_score()
score()
ただし、他の場所では、ここやここ(dmi3knoによる2番目の回答)のようにを使用しています。だから私はどちらがもっと理にかなっているのだろうと思っていましたか?コメントは大歓迎です!