どのポイント予測誤差測定を使用するかを決定するには、一歩後退する必要があります。私たちは将来の結果を完全には知らないし、これまでも知らないことに注意してください。したがって、将来の結果は確率分布に従います。一部の予測方法では、このような完全な分布を明示的に出力しますが、出力しないものもありますが、暗黙的にのみ存在する場合は常に存在します。
ここで、ポイント予測のための適切なエラー測定が必要です。このような点予報Ftは、将来の密度のいわゆる汎関数と呼ばれる単一の数値を使用して、時刻tでの将来の分布(すなわち、予測分布)について知っていることを要約する試みです。エラー測定は、この単一番号の要約の品質を評価する方法です。
そのため、(未知の、予測される可能性があるが、暗黙的である)将来の密度の「良い」1つの数値の概要に報いるエラー指標を選択する必要があります。
課題は、さまざまなエラー測定値がさまざまな機能によって最小化されることです。予想されるMSEは、将来の分布の予想される値によって最小化されます。予想されるMADは、将来の分布の中央値によって最小化されます。したがって、MAEを最小化するために予測を調整すると、ポイント予測は将来の期待値ではなく将来の中央値になり、将来の分布が対称でない場合は予測にバイアスがかかります。
これは、通常歪んでいるカウントデータに最も関連しています。極端な場合(たとえば、ポアソンは、以下の平均で販売を分散ではlog2≈0.69)、あなたのMAEはフラットなゼロ予測の最安になります。参照してくださいここでまたはここやここにをご覧ください。
私はいくつかのより多くの情報とでイラスト与える平均絶対誤差率(MAPE)の欠点は何を?そのスレッドはmapeを考慮しますが、他のエラー対策も考慮し、他の関連するスレッドへのリンクを含みます。
最終的に、どのエラー測定値を使用するかは、予測コストのコスト、つまり、どの種類のエラーが最も苦痛かによって異なります。予測エラーの実際の意味を見ることなく、「より良い基準」に関する議論は基本的に無意味です。
予測精度の測定値は、数年前の予測コミュニティで大きな話題でしたが、今でも時々登場しています。注目すべき非常に良い記事の1つは、Hyndman&Koehlerの「予測精度の測定値の別の見方」です(2006年)。
最後に、1つの選択肢は、完全な予測密度を計算し、適切なスコアリングルールを使用してこれらを評価することです。