ピアソンの相関係数を機械学習の最適化目標として使用する


12

機械学習(回帰問題の場合)では、最小化する誤差関数(および正則化項)として平均二乗誤差(MSE)または平均絶対誤差(MAE)が使用されることがよくあります。相関係数を使用する方が適切な状況があるのでしょうか。そのような状況が存在する場合:

  1. MSE / MAEと比較して、どのような状況で相関係数が優れたメトリックになりますか?
  2. これらの状況で、MSE / MAEはまだ使用するのに適したプロキシコスト関数ですか?
  3. 相関係数の最大化は直接可能ですか?これは使用する安定した目的関数ですか?

相関係数が直接最適化の目的関数として使用されるケースは見つかりませんでした。このエリアの情報を教えていただければ幸いです。

回答:


7

相関の最大化は、出力のノイズが非常に多い場合に役立ちます。つまり、入力と出力の関係は非常に弱いものです。そのような場合、MSEを最小化すると、出力がゼロに近くなる傾向があり、予測エラーはトレーニング出力の分散と同じになります。

勾配降下法では、直接相関を目的関数として使用できます(単にマイナス相関を最小化するように変更します)。ただし、コスト関数と勾配にはすべてのトレーニングサンプルの出力が含まれるため、SGDアプローチで最適化する方法がわかりません。

相関を最大化する別の方法は、出力分散をトレーニング出力分散と同じになるように制約してMSEを最小化することです。ただし、制約にはすべての出力も含まれるため、(私の意見では)SGDオプティマイザーを利用する方法はありません。

編集:ニューラルネットワークの最上位層が線形出力層である場合、MSEを最小化し、線形層の重みとバイアスを調整して相関を最大化できます。調整はCCAと同様に行うことができます(https://en.wikipedia.org/wiki/Canonical_analysis)。


1

私たちの研究ではピアソンの相関関係を使用しており、うまく機能しています。私たちの場合、それは非常に安定しています。これは平行移動およびスケール不変の測定であるため、正確な値ではなく、形状を予測する場合にのみ役立ちます。したがって、ターゲットがモデルの解空間にあるかどうかがわからず、形状のみに関心がある場合に役立ちます。逆に、MSEは予測とターゲットの間の平均距離を短くするため、データを可能な限り近似しようとします。通常は正確な値を予測することに関心があるため、これがMSEがより広く使用される理由です。MSEを最小化すると、相関が増加します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.