モデルの比較にR 2乗値は適切ですか?


17

私は、自動車の広告サイトで利用可能な価格と機能を使用して、自動車の価格を予測するための最良のモデルを特定しようとしています。

このために、scikit-learnライブラリーのモデルと、pybrainとneurolabのニューラルネットワークモデルを使用しました。これまでに使用したアプローチは、いくつかのモデル(機械学習アルゴリズム)で一定量のデータを実行し、scikit-learnメトリックモジュールで計算されたR2値を比較することです。

  1. あるR2異なるモデルの性能を比較するための良い方法は?
  2. エラスティックネットやランダムフォレストなどのモデルでは非常に許容できる結果が得られましたが、ニューラルネットワークモデルのR2値は非常に低いので、R2はニューラルネットワーク(または非線形手法)を評価するための適切な方法ですか?

2
短い答えはノーです。ここで私の答えを読むのに役立つかもしれません:あなたの質問にかなり密接に関連している最良のモデルを選択するためのモデル評価と比較。候補ソリューションはここに記述されています。より一般的な理解のために、モデル選択タグの下に分類されたサイトのスレッドのいくつかを読んでみてください。
GUNG -復活モニカ

@gungありがとうございます!ニューラルネットワークを使用した回帰の適切な適合度の尺度は何でしょうか?
マニック14

回答:


18

あなたの質問に答える際に考慮すべき重要な部分は

自動車の価格を予測するための最良のモデルを特定しようとしています

このステートメントは、モデルを使用する理由について何かを暗示しているためです。モデルの選択と評価は、近似値で達成したいものに基づいている必要があります。

R2ei=yiy^iyiy^iSSR:=i=1Nei2SST:=i=1N(yiy¯)2R2R2=1SSR/SST

R2Y¯MM:MMMSSTR2SSRMM

R2SSR L2L1

R2Lp1p<2。以下のため、あなたは絶対偏差の意味で罰するでしょう。これは、購入者の目標と意図を反映していると見ることができ、推定値を下方に偏らせることは購入者にとって興味深いかもしれません。逆に、売り手の価格予測をモデル化する場合、考えを逆にすることができます。言うまでもなく、モデル /は、モデラー/モデル化するエージェントの好みを反映するように選択できます。また、ノルムの外側で完全に処罰し、一方の側で定数損失、指数損失、または対数損失を使用し、他方で異なる損失を使用することもできます。p=1LpLp

要約すると、モデルの選択/評価は、モデルの目的とは無関係に考えることはできません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.