最近、さまざまな予測方法(MEAN、RWF、ETS、ARIMA、MLP)を適用しましたが、MEANが驚くほどうまくいったことがわかりました。(MEAN:将来の予測はすべて、観測値の算術平均に等しいと予測されます。)MEANは、使用した3つのシリーズでARIMAよりも優れていました。
私が知りたいのは、これが異常かどうかです。これは、私が使用している時系列が奇妙だということですか?または、これは何か間違ったことを設定したことを示していますか?
最近、さまざまな予測方法(MEAN、RWF、ETS、ARIMA、MLP)を適用しましたが、MEANが驚くほどうまくいったことがわかりました。(MEAN:将来の予測はすべて、観測値の算術平均に等しいと予測されます。)MEANは、使用した3つのシリーズでARIMAよりも優れていました。
私が知りたいのは、これが異常かどうかです。これは、私が使用している時系列が奇妙だということですか?または、これは何か間違ったことを設定したことを示していますか?
回答:
私は実務家であり、予測のプロデューサーとユーザーの両方であり、訓練を受けた統計学者ではありません。以下に、経験的証拠に依存する研究記事を参照して、平均予測がARIMAよりも優れている理由についての私の考えをいくつか共有します。私が何度も参照している本の1つは、Armstrongによる予測の本とそのWebサイトです。これは、あらゆる予測者にとって優れた読み物としてお勧めします。
あなたの最初の質問に答えるために -私が知りたいのは、これが異常かどうかです。
時系列データおよび断面データの外挿と呼ばれる章もあり、同じWebサイトから無料で入手できます。以下はこの章からの引用です
「たとえば、29の毎月のシリーズを調べたリアルタイムのM2競争では、Box-Jenkinsは最も不正確な方法の1つであり、全体の中央値誤差は単純な予測よりも17%大きいことが判明しました」
平均予測がARIMAモデルよりも優れていた理由に関する経験的証拠があります。
経験的競争と、Box-Jenkins ARIMAアプローチが正確な予測を生成できず、単変量トレンド外挿に対してより良いパフォーマンスを示す証拠を欠く3番目のM3競争の研究も行われています。
同じウェブサイトには、グリーンとアームストロングによる「シンプルな予測:就寝前の涙を避ける」というタイトルの別の論文と進行中の研究もあります。この論文の著者は次のように要約しています。
合計で、複雑な方法による予測の精度と単純な方法による予測の正確さの94の正式な比較を組み込んだ29の論文を特定しましたが、すべての場合に洗練された単純な方法ではありません。比較の83%は、単純な方法からの予測が、複雑な方法からの予測よりも正確であるか、同様に正確であることがわかりました。平均して、複雑な方法からの予測の誤差は、誤差の比較を提供する21の研究の単純な方法からの予測の誤差よりも約32パーセント大きかった
あなたの3番目の質問に答えるために:これは私が何か間違った設定をしたことを示していますか?いいえ、ARIMAは複雑な方法であり、平均予測は単純な方法であると考えます。平均予測のような単純な方法がARIMAのような複雑な方法よりも優れているという十分な証拠があります。
あなたの2番目の質問に答えるために:これは私が使用している時系列が奇妙であることを意味しますか?
以下は、私が実世界の予測の専門家であると考えたものです。
上記のすべての研究者は、ARIMAのような複雑な方法に対して、単純さ(平均予測のような方法)を提唱しています。そのため、経験的証拠に基づいて、予測が良好であり、複雑さよりも単純さを常に好むことに安心する必要があります。これらの研究者は全員、応用予測の分野に多大な貢献をしてきました。
シンプルな予測方法のステファンの良いリストに加えて。Theta予測法と呼ばれる別の方法もありますが、これは非常に単純な方法です(基本的に、線形回帰の傾きの1/2に等しいドリフトを持つ単純指数平滑法)。これをツールボックスに追加します。Forecast package in R
このメソッドを実装します。
これはまったく驚くことではありません。予測では、次のような非常に簡単な方法を見つけることが非常に多くあります。
より複雑な方法よりも優れています。そのため、これらの非常に単純なベンチマークに対して常にメソッドをテストする必要があります。
George AthanosopoulosとRob Hyndman(この分野の専門家)からの引用:
いくつかの予測方法は非常にシンプルで、驚くほど効果的です。
ベンチマークとしていくつかの非常に単純な方法を使用すると明示的に言っていることに注意してください。
実際、予測に関する無料のオープンなオンライン教科書全体が非常に推奨されています。
編集:よく受け入れられている予測誤差測定の1つである、Hindman&Koehlerによる平均絶対誤差(MASE)(こちらも参照)は、与えられた予測が(サンプル内の)素朴なランダムウォーク予測でどれだけ改善するかを測定します:if MASE <1、予測はサンプル内のランダムウォークよりも優れています。あなたはこれが簡単に打ち負かされたバウンドであることを期待するでしょう?
そうではありません:ARIMAやETSのような複数の標準予測方法の中で最高のものでも、1.38のMASEしか得られません。つまり、(サンプル内)ランダムウォーク予測よりも悪い(サンプル外)になります。これは、ここで質問を生成するのに十分に混乱させます。(MASEはサンプル外の精度を単純な方法のサンプル内の精度と比較するため、この質問はこの質問の複製ではありませんが、現在の質問に対しても啓発的です。)