線形回帰の結果を評価する方法

8

線形回帰の問題があります。つまり、データセットがあり、それを2つのサブセットに分割しました。1つのサブセットは線形回帰を見つけるために使用され（トレーニングサブセット）、別のサブセットはそれを評価するために使用されます（評価サブセット）。私の質問は、この線形回帰の結果をデータの評価サブセットに適用した後、どのように評価するかです。

詳細は次のとおりです。

トレーニングサブセットでは、線形回帰を行います：、ここではグラウンドトゥルース（ターゲットとも呼ばれます）、は独立変数です。次に、とを見つけまし。（とはトレーニングサブセットで指定されます）。 $y = ax + b$ $y$ $x$ $a$ $b$ $x$ $y$

ここで、トレーニングサブセットから上記で見つかっとを使用し、それらを評価サブセットに適用します見つかりました。つまり、これらのはした線形回帰から求められます。ここで、に加えて、評価セットからもします。結果をどのように評価しますか（はとどれだけ異なるか）？それを行うための一般的な数学モデルはありますか？ある種の数学モデル/数式である必要があります。さまざまな方法を考えることができますが、それらはすべてアドホックまたはシンプルですが、これは科学的な研究のためのものであり、残念ながらアドホックなものはここでは使用できません。 $a$ $b$ $y' = ax' + b$ $y'$ $x'$ $y'$ $y$ $y'$ $y$

何か案が？

regression linear-model

— ヴァン
ソース

6

この種の評価が単純な回帰モデルで一般的に使用されるとは思いません。データセット全体を使用して回帰パラメーターを生成することから何もわからないことは何を意味しますか？通常、評価データセットを使用する理由は、過剰適合を防ぐためですが、モデルに含まれる独立変数が1つだけであることがすでにわかっている場合は問題ありません。

— 12

明確にするために、@ octernは線形回帰について話していました。トレーニングとテストの分割は、ロジスティック回帰を使用してこれを行うのに最適な方法です。テストセットがトレーニングとは異なる/非定常分布である場合、または異なる期間（たとえば、広告キャンペーン、ショッピング行動）に由来する場合は、線形回帰でも意味があります。

— smci

11

線形モデルにトレイン/テストスプリット（または相互検証のようなもの）を使用している人はめったに見られないという@Octernに同意します。このような非常に単純なモデルでは、（ほとんど）オーバーフィットは確かに問題ではありません。

モデルの「品質」を理解したい場合は、回帰係数の周囲の信頼区間（または同等のベイジアン）を報告することができます。これを行うにはいくつかの方法があります。エラーが正常に分布していることがわかっている、または想定できる場合は、簡単な式があります（最も一般的なデータ分析パッケージでこれらの値が得られます）。もう1つの一般的な代替策は、リサンプリング（たとえば、ブートストラップやジャックナイフ処理）を通じてそれらを計算することです。これにより、エラーの分布に関する仮定が少なくなります。どちらの場合も、計算には完全なデータセットを使用します。

— マット・クラウス
ソース

1

また、プロットによって残差分析を行う必要があります。

— kjetil b halvorsen 2016

1

線形学習モデルに本当に問題がなく、テストデータをどれだけ正確に予測できるかを知りたい場合は、既に持っている線形モデルの式を使用し、推定係数a（=切片）を含めるだけで済みます。と最初のモデルから得られたb（回帰係数、勾配とも呼ばれます）。

y = a + b * Xのように見えるはずですが、ここでは架空の数値がいくつかあります... y = 2 + 0.5 * X

どのソフトウェアを使用していますか？Rを使用していますか？その場合、predict.lm（）関数を使用して、2番目のデータセットに適用できます。

— イェンス
ソース

1

これは主に目標が何であるかによって大きく異なりますが、これを行う簡単で標準的な方法は、平均二乗誤差（MSE）を測定することです。したがって、入力/出力ペアで構成されるテストデータセットある場合、パラメータおよび場合、MSEは次のように計算できます。 $\mathcal{D}$ $\mathcal{D} = \{(x_1, y_1), (x_2, y_2), \ldots, (x_n, y_n)\}$ $a$ $b$

{MSE}_{a, b} = \frac{1}{n} \sum_{i = 1}^{n} (y_{i} - (a x_{i} + b))^{2} .

$\text{MSE}_{a,b} = \frac{1}{n}\sum_{i=1}^n (y_i - (ax_i + b))^2.$

これは、パラメータおよびを見つけるために使用した基準である可能性が高いため、おそらくエラーを測定するための賢明な方法でもあります。推定されたパラメーターがどれだけ一般化しているかについてより良いアイデアを得たい場合は、相互検証のようなものを検討する必要があります。 $a$ $b$

— アルト
ソース