MEANがARIMAを上回ることは珍しいですか?


38

最近、さまざまな予測方法(MEAN、RWF、ETS、ARIMA、MLP)を適用しましたが、MEANが驚くほどうまくいったことがわかりました。(MEAN:将来の予測はすべて、観測値の算術平均に等しいと予測されます。)MEANは、使用した3つのシリーズでARIMAよりも優れていました。

私が知りたいのは、これが異常かどうかです。これは、私が使用している時系列が奇妙だということですか?または、これは何か間違ったことを設定したことを示していますか?



@Mehrdad人なら、マーティンゲールズの周辺で間違いなく素敵な答えを作ることができます。
シャドウトーカー14年

1
単純なメソッドがうまく機能することは非常に一般的で、特にサンプル外(重要な場合)です。この効果は、短いシリーズで強くなります。系列相関または傾向があまりない場合、比較的長い系列であっても平均が非常にうまくいくと予想されます。
-Glen_b-モニカーの復活2014

回答:


31

私は実務家であり、予測のプロデューサーとユーザーの両方であり、訓練を受けた統計学者ではありません。以下に、経験的証拠に依存する研究記事を参照して、平均予測がARIMAよりも優れている理由についての私の考えをいくつか共有します。私が何度も参照している本の1つは、Armstrongによる予測の本とそのWebサイトです。これは、あらゆる予測者にとって優れた読み物としてお勧めします。

あなたの最初の質問に答えるために -私が知りたいのは、これが異常かどうかです。

時系列データおよび断面データの外挿と呼ばれる章もあり、同じWebサイトから無料で入手できます。以下はこの章からの引用です

「たとえば、29の毎月のシリーズを調べたリアルタイムのM2競争では、Box-Jenkinsは最も不正確な方法の1つであり、全体の中央値誤差は単純な予測よりも17%大きいことが判明しました」

平均予測がARIMAモデルよりも優れていた理由に関する経験的証拠があります。

経験的競争と、Box-Jenkins ARIMAアプローチが正確な予測を生成できず、単変量トレンド外挿に対してより良いパフォーマンスを示す証拠を欠く3番目のM3競争の研究も行われています。

同じウェブサイトには、グリーンとアームストロングによる「シンプルな予測:就寝前の涙を避ける」というタイトルの別の論文と進行中の研究もあります。この論文の著者は次のように要約しています。

合計で、複雑な方法による予測の精度と単純な方法による予測の正確さの94の正式な比較を組み込んだ29の論文を特定しましたが、すべての場合に洗練された単純な方法ではありません。比較の83%は、単純な方法からの予測が、複雑な方法からの予測よりも正確であるか、同様に正確であることがわかりました。平均して、複雑な方法からの予測の誤差は、誤差の比較を提供する21の研究の単純な方法からの予測の誤差よりも約32パーセント大きかった

あなたの3番目の質問に答えるために:これは私が何か間違った設定をしたことを示していますか?いいえ、ARIMAは複雑な方法であり、平均予測は単純な方法であると考えます。平均予測のような単純な方法がARIMAのような複雑な方法よりも優れているという十分な証拠があります。

あなたの2番目の質問に答えるために:これは私が使用している時系列が奇妙であることを意味しますか?

以下は、私が実世界の予測の専門家であると考えたものです。

  • Makridakis(M、M2、M3と呼ばれる予測に関する先駆的な経験的競争、および予測におけるエビデンスに基づく方法の舗装された方法)
  • アームストロング(予測実践に関する書籍/記事の形で貴重な洞察を提供します)
  • Gardner(ARIMAに対して驚くほどうまく機能する別の簡単な方法を発明したDamped Trend指数平滑法)

上記のすべての研究者は、ARIMAのような複雑な方法に対して、単純さ(平均予測のような方法)を提唱しています。そのため、経験的証拠に基づいて、予測が良好であり、複雑さよりも単純さを常に好むことに安心する必要があります。これらの研究者は全員、応用予測の分野に多大な貢献をしてきました。

シンプルな予測方法のステファンの良いリストに加えて。Theta予測法と呼ばれる別の方法もありますが、これは非常に単純な方法です(基本的に、線形回帰の傾きの1/2に等しいドリフトを持つ単純指数平滑法)。これをツールボックスに追加します。Forecast package in Rこのメソッドを実装します。


2
私はあなたが予測について提供する視点とそれを裏付ける証拠を本当に気に入っていますが、この答えの要素は、「統計学者」またはおそらく正式な統計トレーニングに対する暴言のように読みすぎており、間違っているので、好ましくありません。たとえば、Makridakisの高度な学位は(推測)統計にあり、それが彼が教えていることであり、それが彼がしていることです。
whuber

1
わかった、削除する。私は、エビデンスに基づいた方法の大きな進歩が非統計学者から来たと主張しようとしていました。しかし、私はそれがそのように出くわすかもしれないというあなたのポイントを見ます
予報官14年


FWIW、彼のLinkedInのページ --which 彼は維持-リストの両方の統計では彼の博士号取得者。しかし、議論は無意味です:誰かが統計学者ではないという理由で統計学者ではないと主張することはほとんど価値がなく、ここのポイントの横にあります。(ごく最近まで、統計学でキャリアを積んでいたほとんどの人々は、利用可能な統計プログラムがほとんどなかったため、他の分野で学位を取得していました。)
whuber

2
+1。ただし、「平均予測がARIMAモデルよりも優れている理由に関する経験的証拠がある」と書いています。-いいえ、これは、なぜではなく、(この特定の例では)平均が優れてたことを示しています。私は議論をひっくり返して、ARIMAと他のモデルに証明の負担をかけるでしょう。データ生成プロセスがモデルに対する過去のエラーを気にする必要がある理由を理解したことはありません。私の個人的な疑いは、ARIMAが非常に人気があることです。なぜなら、ユニットのルートや定常性などを実際に証明できるからです。
S. Kolassa-復帰モニカ14年

36

これはまったく驚くことではありません。予測では、次のような非常に簡単な方法を見つけることが非常に多くあります。

  • 全体の平均
  • 素朴なランダムウォーク(つまり、予測として使用される最後の観測)
  • 季節ランダムウォーク(つまり、1年前からの観測)
  • 単一指数平滑化

より複雑な方法よりも優れています。そのため、これらの非常に単純なベンチマークに対して常にメソッドをテストする必要があります。

George AthanosopoulosとRob Hyndman(この分野の専門家)からの引用

いくつかの予測方法は非常にシンプルで、驚くほど効果的です。

ベンチマークとしていくつかの非常に単純な方法を使用すると明示的に言っていることに注意してください。

実際、予測に関する無料のオープンなオンライン教科書全体が非常に推奨されています。

編集:よく受け入れられている予測誤差測定の1つである、Hindman&Koehlerによる平均絶対誤差(MASE)(こちらも参照)は、与えられた予測が(サンプル内の)素朴なランダムウォーク予測でどれだけ改善するかを測定します:if MASE <1、予測はサンプル内のランダムウォークよりも優れています。あなたはこれが簡単に打ち負かされたバウンドであることを期待するでしょう?

そうではありません:ARIMAやETSのような複数の標準予測方法の中で最高のものでも、1.38のMASEしか得られません。つまり、(サンプル内)ランダムウォーク予測よりも悪い(サンプル外)になります。これは、ここで質問を生成するのに十分に混乱させます。(MASEはサンプル外の精度を単純な方法のサンプル内の精度と比較するため、この質問はこの質問の複製ではありませんが、現在の質問に対しても啓発的です。)


1
受け入れてくれてありがとう、でも1日待ちたい-質問が答えを受け入れた場合、コメントや答えはもちろんのこと、それを読む人も少なくなります。そして、他の人々はこれについて異なる見解を持っているかもしれません。
遠慮なく

あなたのそれは非常に正直です:)私はそれを一日与えます。ありがとう。
アンディT 14年

9
「複雑」は「過剰適合」の近縁です。
シャドウトーカー14年

1
+1いい答え。予測が医学のような証拠に基づいた分野である場合、ARIMA手法は歴史になります。
予報官14年

2
Gaussian Assumptionsを検証しない単純なARIMAは、ほとんどの人にとってすでに歴史ですが、明らかにすべてではありません!
IrishStat 14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.