回答:
割合としてのMAPEは、区分と比率が意味のある値に対してのみ意味を持ちます。たとえば、温度の割合を計算するのは理にかなっていないため、MAPEを使用して温度予測の精度を計算しないでください。
単一の実績がゼロである場合、である場合、未定義のMAPEの計算でゼロで除算します。
それにもかかわらず、一部の予測ソフトウェアは、単に実績がゼロの期間を削除するだけで、そのようなシリーズのMAPEを報告することがわかりました(Hoover、2006)。言うまでもなく、これはない、それは我々が実際にはゼロだった場合、我々は予測かについては全く気にしないことを暗示するように、良いアイデア-しかし、の予測との1 非常に持っていること異なる意味。だからあなたのソフトウェアが何をするかを確認してください。
数個のゼロしか発生しない場合は、重み付きMAPEを使用できます(Kolassa&Schütz、2007)が、それでも独自の問題があります。これは、対称MAPEにも適用されます(Goodwin&Lawton、1999)。
100%を超えるMAPEが発生する可能性があります。一部の人々が100%-MAPEと定義する精度で作業することを好む場合、これは負の精度につながる可能性があり、人々は理解に苦労する可能性があります。(いいえ、ゼロで精度を切り捨てることは良い考えではありません。)
予測したい厳密に正のデータがある場合(および上記に従って、それ以外の場合MAPEは意味をなしません)、ゼロ未満を予測することはありません。残念ながら、MAPEは、オーバーフォーキャストをアンダーフォーキャストとは異なる方法で扱います。アンダーフォーキャストは、100%を超えることはありません(たとえば、と)が、overforecastの寄与は(無制限です例えば、もしと)。これは、偏りのない予測の場合よりも偏った場合の方がMAPEが低くなる可能性があることを意味します。最小化すると、予測が低く偏る可能性があります。
特に最後の箇条書きはもう少し考えに値します。このためには、一歩後退する必要があります。
。
ここでの問題は、将来のディストリビューションの優れたワンナンバーサマリーが何であるかを人々が明言することがめったにないことです。
問題は次のとおりです。MAPEを最小化すると、通常、この期待を出力するように動機付けられませんが、1つの数字の要約はまったく異なります(McKenzie、2011、Kolassa、2020)。これには2つの異なる理由があります。
水平線は、最適なポイント予測を提供します。ここで、「最適性」は、さまざまなエラー測定値に対して予想されるエラーを最小化することとして定義されます。
将来の分布の非対称性は、MAPEが過大予測と過小予測に差別的にペナルティを課すという事実とともに、MAPEを最小化すると予測の偏りが大きくなることを意味することがわかります。(以下は、ガンマの場合の最適なポイント予測の計算です。)
この場合:
(図には示されていない)と予想MAEを最小化します。この間隔のすべての値は、時系列の中央値です。
また、MAPEを最小化すると、予測の偏りが予測の偏りにつながる可能性があることがわかります。この場合、問題は非対称分布ではなく、データ生成プロセスの変動係数が高いことに起因しています。
これは実際には、MAPEの欠点について人々に教えるために使用できるシンプルなイラストです。参加者にいくつかのサイコロを渡して転がしてもらうだけです。詳細については、Kolassa&Martin(2011)を参照してください。
対数正規の例:
mm <- 1
ss.sq <- 1
SAPMediumGray <- "#999999"; SAPGold <- "#F0AB00"
set.seed(2013)
actuals <- rlnorm(100,meanlog=mm,sdlog=sqrt(ss.sq))
opar <- par(mar=c(3,2,0,0)+.1)
plot(actuals,type="o",pch=21,cex=0.8,bg="black",xlab="",ylab="",xlim=c(0,150))
abline(v=101,col=SAPMediumGray)
xx <- seq(0,max(actuals),by=.1)
polygon(c(101+150*dlnorm(xx,meanlog=mm,sdlog=sqrt(ss.sq)),
rep(101,length(xx))),c(xx,rev(xx)),col="lightgray",border=NA)
(min.Ese <- exp(mm+ss.sq/2))
lines(c(101,150),rep(min.Ese,2),col=SAPGold,lwd=3,lty=2)
(min.Eae <- exp(mm))
lines(c(101,150),rep(min.Eae,2),col=SAPGold,lwd=3,lty=3)
(min.Eape <- exp(mm-ss.sq))
lines(c(101,150),rep(min.Eape,2),col=SAPGold,lwd=3,lty=4)
par(opar)
サイコロの例:
SAPMediumGray <- "#999999"; SAPGold <- "#F0AB00"
set.seed(2013)
actuals <- sample(x=1:6,size=100,replace=TRUE)
opar <- par(mar=c(3,2,0,0)+.1)
plot(actuals,type="o",pch=21,cex=0.8,bg="black",xlab="",ylab="",xlim=c(0,150))
abline(v=101,col=SAPMediumGray)
min.Ese <- 3.5
lines(c(101,150),rep(min.Ese,2),col=SAPGold,lwd=3,lty=2)
min.Eape <- 2
lines(c(101,150),rep(min.Eape,2),col=SAPGold,lwd=3,lty=4)
par(opar)
グナイティング、T。 。ポイント予測の作成と評価。Journal of the American Statistics Association、2011、106、746-762
グッドウィン、P。&ロートン、R。 . 対称MAPEの非対称性について。International Journal of Forecasting、1999、15、405-408
フーバー、J。予測精度の測定:今日の予測エンジンと需要計画ソフトウェアの省略。Foresight:The International Journal of Applied Forecasting、2006、4、32-35
Kolassa、S. 「最高の」ポイント予測がエラーまたは精度の測定値に依存する理由(M4予測コンテストに関する招待コメント)。 International Journal of Forecasting、2020、36(1)、208-211
Kolassa、S.&Martin、R. 割合エラーはあなたの一日を台無しにする可能性があります。予測:国際応用予測ジャーナル、2011、23、21-29
Kolassa、S.&Schütz、W. MAPE に対するMAD / Mean比の利点。予測:国際予測応用ジャーナル、2007、6、40-43
マッケンジー、J。平均絶対誤差と経済予測のバイアス。Economics Letters、2011、113、259-262