訓練されたニューラルネットワークの相関の測定


9

非正規分散データを使用して人工ニューラルネットワーク(バックプロパゲーション、フィードフォワード)をトレーニングしています。二乗平均平方根誤差のほかに、文献は、訓練されたネットの品質を評価するためのピアソン相関係数をしばしば示唆しています。しかし、訓練データが正規分布されていない場合、ピアソン相関係数は妥当ですか?ランクベースの相関測定、たとえばスピアマンローを使用することは、より合理的ではないでしょうか?


それをどのように使用するか、またはリファレンスを与えるかについて詳しく説明できますか?
bayerj 2011年

回答:


6

ピアソン相関係数は線形関連を測定します。経験的な2次中心モーメントに基づいているため、極端な値の影響を受けます。したがって:

  • 実際対予測値の散布図に非線形性の証拠がある場合は、順位相関(スピアマン)係数などの代替案を使用することをお勧めします。

    • 関係が平均して単調に見える場合(図の上段のように)、ランク相関係数が有効になります。

    • そうでない場合、関係は曲線状になり(図の一番下の行の例のように、左端または中央のU字型など)、相関関係の測定値はおそらく不十分な説明になります。ランク相関係数を使用しても、これは修正されません。

  • 散布図に外れ値のデータが存在することは、ピアソン相関係数が線形関係の強さを過大評価している可能性があることを示しています。それは正しい場合とそうでない場合があります。注意して使用してください。ランク相関係数は、範囲外の値がどれだけ信頼できるかに応じて、より良い場合とそうでない場合があります。

散布図とそれらのピアソン相関の例

ピアソンの製品モーメント相関係数に関するウィキペディアの記事からコピーされた画像。)


ランク相関を使用して回帰パフォーマンスを測定することについて、ステートメントのいくつかのソースを提供できますか?
Simon Kuang
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.