回帰問題におけるピアソンの相関の代理としてのMSE


8

TL; DR(長すぎて読まなかった):

私は時系列予測問題に取り組んでいます。これは、ディープラーニング(ケラ)を使用して回帰問題として定式化します。私の予測と真のラベル間のピアソン相関を最適化したいと思います。MSEをプロキシとして使用すると、実際にはピアソンを損失関数として直接使用するよりも(相関の観点から)より良い結果が得られるという事実に戸惑っています。ディープラーニングの損失関数として相関メトリックを使用することは悪い習慣と考えられていますか?もしそうなら、なぜですか?

長いバージョン:

私には時系列予測タスクがあります連続するタイムステップの値を観察し、タイムステップ値を予測する必要があります。通常、値はであるため、これを回帰問題として扱い、ディープラーニング(keras)を使用して解決しています。T + 1 [ - 200 200 ]TT+1[200,200]

私の質問は、損失と測定基準の選択に関するものです。

私のデータの真のラベルは、主に前後にあり、いくつかの極端な値があります。極端な値の多くは誤りであり、それらを正しくすることに集中するように学習をシフトしたくありません。言い換えれば、一般的な傾向を把握できるようになり(正の値と負の値の期間を正しく分類)、たとえば、200ではなく100を予測して「共存」できます。[10,10]

このため、私の評価指標は、予測値と真の値の間のピアソン相関であるべきだと思います。

さて、損失関数について:理想的には、高いピアソン相関を最適化したい場合、それを損失関数として使用することは理にかなっているでしょう?私は「ベースラインモデル」であるシンプルなアーキテクチャを2回テストしました。1回はピアソン(ミニバッチで計算)を直接損失関数として使用し、もう1回は一般的なMSEをプロキシとして使用しました。どちらの場合も、MSEとピアソンの両方を異なるエポックについて追跡し、検証セットに基づいて「早期停止」を行います。

私の結果:

  • 損失としてのMSE:MSE 160、ピアソン0.7
  • 損失としてのピアソン:MSE 250、ピアソン0.6

ピアソン損失のより高いMSEは、相関の最適化にはスケールがないという事実の結果であると理解しています。そのため、すべての予測は、MSEを増加させる方法で要因によって「オフ」になる可能性があります。しかし、MSEをプロキシとして使用すると、ピアソン相関自体の点で実際にどのように改善されるのでしょうか。ピアソン相関を損失関数として使用してはならない理由について、最適化に関連する理由はありますか?実際、ほとんど使われていないようですが、その理由を知りたいと思います。

回答:


2

これは良い質問であり、残念ながら長い間答えられていません。ここでこの質問を行ってから数か月後に部分的に回答があったようです。基本的には、出力が非常に騒々しく、おそらくMSE以外の場合は相関が有用であると主張しています。 。最初に、両方の式を確認する必要があると思います。

MSE(y,y^)=1ni=1n(yiyi^)2
R(y,y^)=i=1n(yiy¯)(yi^y¯^)i=1n(yiy¯)2i=1n(yi^y¯^)2

注意すべきいくつかの点、線形回帰の場合、回帰子の不偏性のためにことがわかっているため、モデルは少し単純になりますが、一般的にはMLアルゴリズムについてこの仮定を行うことはできません。おそらくより広義には、相関のの散布図について考えると、このプロットの2つの間の線形関係がどれほど強いかがわかりますそれらが互いにどのくらい離れているかを教えてくれます。ウィキペディアのページにある反例を見ると、2つの間には表現できない多くの関係があることがわかります。 y¯^=y¯R2{yi,yi^}

一般に、相関はと同様のことを示しますが、方向性があるので、その場合、相関はやや説明的です。別の解釈では、は線形性の仮定に依存せず、モデルによって説明されるの変動のパーセンテージを示すだけです。つまり、モデルの予測を、すべての点の平均を推測する単純な予測と比較します。の式は次のとおりです。R2R2yR2

R2(y,y^)=1i=1n(yiy^)2i=1n(yiy¯)2


だから、どのようにと比較?さて、は入力の1つをスケールアップすることに対してより耐性があることがわかります。これは、が両方の入力でのみ0の同次であり、がいずれかの入力で0の次で同種であるという事実に関係しています。機械学習の観点からこれが何を意味するかは少し明確ではありませんが、モデルクラスは、相関の下で少し柔軟になる可能性があることを意味する場合があります。ただし、いくつかの追加の前提条件の下では、2つの測定値は同じであり、詳細についてはこちらをご覧くださいRR2RR2RYy^

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.