線形回帰の問題があります。つまり、データセットがあり、それを2つのサブセットに分割しました。1つのサブセットは線形回帰を見つけるために使用され(トレーニングサブセット)、別のサブセットはそれを評価するために使用されます(評価サブセット)。私の質問は、この線形回帰の結果をデータの評価サブセットに適用した後、どのように評価するかです。
詳細は次のとおりです。
トレーニングサブセットでは、線形回帰を行います:、ここではグラウンドトゥルース(ターゲットとも呼ばれます)、は独立変数です。次に、とを見つけまし。(とはトレーニングサブセットで指定されます)。y x a b x y
ここで、トレーニングサブセットから上記で見つかっとを使用し、それらを評価サブセットに適用します見つかりました。つまり、これらのはした線形回帰から求められます。ここで、に加えて、評価セットからもします。結果をどのように評価しますか(はとどれだけ異なるか)?それを行うための一般的な数学モデルはありますか?ある種の数学モデル/数式である必要があります。さまざまな方法を考えることができますが、それらはすべてアドホックまたはシンプルですが、これは科学的な研究のためのものであり、残念ながらアドホックなものはここでは使用できません。b y ′ = a x ′ + b y ′ x ′ y ′ y y ′ y
何か案が?