別の指標(MSEなど)ではなく、特定の予測誤差(MADなど)を使用するのはなぜですか?


15

MAD =平均絶対偏差MSE =平均二乗誤差

いくつかの望ましくない品質にもかかわらずMSEが使用されるというさまざまな場所からの提案を見てきました(例:http: //www.stat.nus.edu.sg/~staxyc/T12.pdf、p8に「MAD MSEよりも優れた基準です。ただし、数学的にMSEはMADよりも便利です。」

それ以上のものはありますか?予測誤差を測定するさまざまな方法が多かれ少なかれ適切である状況を徹底的に分析する論文はありますか?私のグーグル検索では何も明らかにされていません。

これと同様の質問が/programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sdeで尋ねられ、ユーザーはstats.stackexchange.comに投稿しますが、私は彼らがこれまで行ったことはないと思います。


2
MADは通常、平均ではなく、絶対偏差の中央値です。
ブライアンD

@BrianD:より広い統計コミュニティでは、あなたは正しい。狭い予測コミュニティでは、「MAD」は常に「平均絶対偏差」、別名MAEです。
S. Kolassa -復活モニカ

回答:


23

どのポイント予測誤差測定を使用するかを決定するには、一歩後退する必要があります。私たちは将来の結果を完全には知らないし、これまでも知らないことに注意してください。したがって、将来の結果は確率分布に従います。一部の予測方法では、このような完全な分布を明示的に出力しますが、出力しないものもありますが、暗黙的にのみ存在する場合は常に存在します。

ここで、ポイント予測のための適切なエラー測定が必要です。このような点予報Ftは、将来の密度のいわゆる汎関数と呼ばれる単一の数値を使用して、時刻tでの将来の分布(すなわち、予測分布)について知っていることを要約する試みです。エラー測定は、この単一番号の要約の品質を評価する方法です。

そのため、(未知の、予測される可能性があるが、暗黙的である)将来の密度の「良い」1つの数値の概要に報いるエラー指標を選択する必要があります。

課題は、さまざまなエラー測定値がさまざまな機能によって最小化されることです。予想されるMSEは、将来の分布の予想される値によって最小化されます。予想されるMADは、将来の分布の中央値によって最小化されます。したがって、MAEを最小化するために予測を調整すると、ポイント予測は将来の期待値ではなく将来の中央値になり、将来の分布が対称でない場合は予測にバイアスがかかります。

これは、通常歪んでいるカウントデータに最も関連しています。極端な場合(たとえば、ポアソンは、以下の平均で販売を分散ではlog20.69)、あなたのMAEはフラットなゼロ予測の最安になります。参照してくださいここでまたはここここにをご覧ください。

私はいくつかのより多くの情報とでイラスト与える平均絶対誤差率(MAPE)の欠点は何を?そのスレッドは考慮し、他のエラー対策も考慮し、他の関連するスレッドへのリンクを含みます。


最終的に、どのエラー測定値を使用するかは、予測コストのコスト、つまり、どの種類のエラーが最も苦痛かによって異なります。予測エラーの実際の意味を見ることなく、「より良い基準」に関する議論は基本的に無意味です。

予測精度の測定値は、数年前の予測コミュニティで大きな話題でしたが、今でも時々登場しています。注目すべき非常に良い記事の1つは、Hyndman&Koehlerの「予測精度の測定値の別の見方」です(2006年)。

最後に、1つの選択肢は、完全な予測密度を計算し、適切なを使用してこれらを評価することです。


回答とリンクをありがとう。「予測エラーのコスト」という用語には慣れていませんでした。(たとえば)ビジネスが販売するウィジェットの数を予測している状況に関連しているように見えます。おそらく、彼らが過大評価して苦しむ痛みは、過小評価して苦しむ痛みの2倍です。しかし、私はに一般人が予測エラーの容易に明らかなコストなしで予測を行っているコンテキストについて考えています(例えば、「ビル・ゲイツは今後5か月でどれだけツイートするか?」)。このような状況では、エラー測定の選択は任意ですか?
user1205901-モニカを

3
予測誤差のコストは、開業医志向のジャーナルで議論されてきたフォーサイトforecasters.org/foresight非常にお勧め!(完全な開示:私はアソシエイトエディターです。)CoFEはあなたの例ではすぐに明らかにならないことに同意しますが、エラー測定の最適化に実際にどれだけの労力を費やすべきか疑問に思います...
S. Kolassa-モニカの復活

4

MSEの代わりにMAEを使用する利点は、DavydenkoおよびFildes(2016)で説明されています。セクション3.1を参照してください。

...一部の著者(たとえば、Zellner、1986)は、予測を評価する基準は、予測を最適化する基準に対応する必要があると主張しています。言い換えると、特定の損失関数を使用して推定値を最適化する場合、より良いモデルを見つけるために、経験的評価に同じ損失関数を使用する必要があります。

統計モデルのフィッティングは、通常、二次損失の下で最適な予測を提供します。これは、たとえば、線形回帰を当てはめるときに発生します。統計モデリングからの密度予測が対称である場合、二次損失の下で最適な予測は線形損失の下でも最適です。ただし、対数変換によって分散を安定化し、指数関数によって予測を逆変換すると、線形損失の下でのみ最適な予測が得られます。別の損失を使用する場合、最初に統計モデルを使用して密度予測を取得し、次に特定の損失関数を指定して推定値を調整する必要があります(Goodwin、2000でこれを行う例を参照)。

2つの方法を経験的に比較し、どちらの方法が対称線形損失の観点で優れているかを調べたいと仮定します(このタイプの損失は一般的にモデリングで使用されるため)。時系列が1つしかない場合は、平均絶対誤差(MAE)を使用するのが自然なようです。また、MAEは、理解と計算が簡単であるため魅力的です(Hyndman、2006)...

参照資料

Davydenko、A.、&Fildes、R.(2016)。予測エラー測定:批判的レビューと実践的推奨。で実用的な問題と解決策:ビジネス予測。ジョン・ワイリー&サンズ


「Davydenko and Fildes、2016」だけでなく、論文の完全な引用をお願いできますか?
シルバーフィッシュ

リンクが停止したことによる悪影響を受けないように、回答はスタンドアロンであることが望ましいです。この質問に関連するコンテンツの重要なポイントであると思われるものを要約するために、あなたの答えをいくらか拡大できると思いますか?それ以外の場合、これは回答よりもコメントに適しています。(コメントを投稿するのに十分な評判が得られていないことに感謝していますが、それをあなたのために変換することができます。)
Silverfish

1
お返事をありがとうございます!統計モデルのフィッティングは、通常、二次損失の下で最適な予測を提供します(Davydenko and Fildes、2016)。これは、たとえば、線形回帰を当てはめるときに発生します。統計モデリングからの密度予測が対称である場合、二次損失の下で最適な予測は線形損失の下でも最適です。しかし、対数変換によって分散を安定させ、その後、べき乗によって予測を逆変換すると、線形損失の下でのみ最適な予測が得られます。
ターボフライ

1
ありがとう!この情報を編集して回答に含めることができます(投稿の下部にある[編集]ボタン)。
シルバーフィッシュ

どうもありがとう。いくつかの書式設定を行い、完全な引用を行いました。
シルバーフィッシュ

3

比較しない理由RMSE=MSEMAE=MAD

実際、

MAERMSEnMAE 回帰モデルの場合:

  • 下限:各ケースは同じ絶対量のエラーをもたらします e
    RMSE=1ne2=1nne2=e=MAE
  • 上限:エラーのある単一のケース e 他のすべてのケースにはエラーがありません:
    MAE=en
    RMSE=1nei2=1ne2=1n(nMAE)2=nMAE

(MAERMSEMAE for classification with partial class memberships yi and/or y^i are [0,1] -- i.e. they can actually take values in between 0 and 1).

  • upper bound: here, ei is 1, so
    MAE=nwrongn
    RMSE=1nei2=1nnwrong=MAE
    (This upper bound occurs for integer nwrong, if you go for partial/fractional class membership and thus also for ei[0,1], things get a bit more complicated because you need to take into account that the maximum possible error can be less than 1, and you may have a "leftover" ei<1 which both lower the upper bound a bit further.)

If the RMSE is close the MAE, you have many small deviations, if it is close to its upper bound, there are few grossly wrong predictions.


do you mean sqrt(n)*MAE or sqrt(n*MAE) as an upper bound?
Chris

1
@Chris: it is sqrt (n) * MAE, see my edit.
cbeleites supports Monica
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.