ポアソン、精度、予測間隔の予測


8

Poissonグループ1-26 months of dataに応じて、グループ分けされたのデータを予測しようとしています。プールされたデータの65% has a value of 025% a value of 1。トレンドや季節性を見つけることができなかったので、いくつかの異なるステーショナリーモデルをテストし始めました。Moving average (3)Moving Average (6)Simple Exponential SmoothingNaïveSimple Mean

私は1-6カ月先に予想して使用する必要があるMADMSERMSEモデルの精度をテストします。最も正確なのと、平均シンプルであるように見えますRMSE of 1MAD of 0,638。これは本当に高いと思いますが、どうすればよいのかわかりません。

私が考えていなかった予測方法がありますか?私は何かを見落としているか?

私は予測区間については見つけることができた唯一のものだったF+tsF-tsしてF、予想通りtとt分布としてalfa (n-2)およびs標準偏差など。本当に信頼できるソースだとは思わないが、他に何も見つからなかったため、これらの予測間隔の設定方法がわからない。この方法は正しいですか?

使用するRがありません。自分でやる必要があります。

回答:


11

いわゆる断続的な需要、つまり「多くの」ゼロを特徴とする需要時系列があります。(時系列自体が需要ではない場合でも、以下のほとんどが当てはまります。)したがって、「断続的な需要を予測するというWeb検索はすでに役に立ちます。Teunter and Duncan(2009、JORS)は、断続的な需要予測方法の概要を説明しています。

断続的な需要を予測する標準的な方法は、クロストンの方法です。デマンドインターバルとゼロ以外のデマンドサイズに個別に指数平滑法を使用ます。その場合、ポイント予測は、平滑化されたゼロ以外の需要と平滑化された需要間間隔の比率です。SyntetosとBoylan(2001、IJPE)は、クロストンはわずかに偏っており、修正を提案していると述べていますが、これは通常、実際にはそれほど大きな違いはありません。

別の方法は、標準のARIMA時系列モデルを変更する整数自己回帰移動平均モデル(INARMA)です。マリアム・モハマディプールはこれらについて論文を書い

私は個人的に、このような期待値予測の有用性について大きな疑問を抱いています。他の期間ごとに1デマンドの時系列は、0.5の期待値を持っています... 4番目の期間ごとに2デマンドの時系列と同様に...以下同様ですが、ポアソンyはますます少なくなります。需要の将来(および予測)の分布全体を理解する方がはるかに有用だと私は主張します。予測間隔を探していることに拍手を送ります!

ただし、見つけた式は、ARIMAモデルを介した連続データの単一指数平滑化にのみ適用されます。SESが最適です。したがって、データをカウントすることはできません。むしろ、ポイント予測を取り、パラメータポアソン分布の分位数を使用することをお勧めします。これは依然としてパラメーター推定の不確実性(モデル選択の不確実性などと共に)を無視しますが、それは単純な可能性であり、おそらくあなたが持っている公式よりも優れています。α2y^λ=y^

Shenstone and Hyndman(2005、JoF)は、Crostonの方法が最適である一貫した確率モデルは存在しないことに注意してください。すべての候補モデルは(1)連続ではなく離散であり、(2)負の値を生成する可能性があります。ただし、これらの候補モデルについては、ShenstoneとHyndmanが予測区間を提供します。

最後に注意が必要です。特に断続的な要求ではなく、MADを使用してカウントデータ予測の精度を評価しないでください。期待MADをすることによって最小化された中央値のない、あなたの将来の分布の平均値、およびあなたがあなたのデータの65%がゼロであることを記述した場合、中央値はゼロです...あなたはおそらくフラットで最低のMADを取得することを意味しています予測がゼロであり、バイアスが大きく、おそらく役に立たない。これは、昨年の国際予測シンポジウムでこの問題について発表したプレゼンテーションです。またはMorlidge(2015、Foresight)ご覧ください。

恥知らずな自己宣伝の最後の部分:私はIJF(Kolassa、2016年)に、ポアソンモデルのさまざまなフレーバーを含む、さまざまな精度測定とさまざまな予測方法で、低ボリュームカウントデータ(大部分は断続的)を予測する記事を掲載しています。これは役立つかもしれません。


1
反応ステファンをありがとう。あなたは私に多くの新しい知識と洞察を与えてくれます、私は完全に方向を変えています。私は非常にあなたの原稿のPDFのように、私はそれが本当に参考になると思うだろう
R.ホワイト

1
別の質問です。よろしければ。この記事では、データの断続性をテストする方法について説明します。qiグループごとの中央値の多くが1の値になっていることに気づきました。これより低い値は実際には可能ではないため、私のグループのほとんどが断続的ではないと想定します。
R.ホワイト

1
その分類は私にとって新しいものです。それは確かに学術文献では一般的ではありません。しかし、私はそのSAS論文の著者を知っており、彼らは通常、彼らが何をしているかを知っています。データに対して断続的および非断続的な方法を試してみて、どれが最も効果的かを確認してから、それがSASペーパーに記載されている基準と関係があるかどうかを確認することをお勧めします。Syntetos&Boylan(2005)およびBoylan et al。(2008)別の分類を与える。
Stephan Kolassa 2016年

3
断続的な需要を予測することは困難です。(!比較的)問題は、ゼロ需要とゼロ以外の需要の違いがあることが大きい-と我々は通常、知らない時にゼロ以外の需要が発生します。いくつかのシミュレーションを実行することをお勧めします。ポアソン確率変数をシミュレートし、(既知の!)期待値を予測したときに得られるRMSEを確認します。これは、需要が平均してどれだけ高いかはわかっている、需要がいつ発生するかわからない状況をシミュレートします。おそらく、RMSEがかなり大きいことがわかります。
Stephan Kolassa

2
ボトムライン:あなたが予想することができない限り時に需要が発生する、断続的な需要がちょうどあるハード予測します。また、あなたが予想した場合、その需要は、期間中に発生しますが、それはない、期間中に発生する、あなたの見通しのかかるプロセスにはかなりOKかもしれ、 -しかし、RMSEやその他のエラー対策はまだ失敗としてこれをカウントされます。 Kourentzes(2014年-私の論文で引用)は、このような「タイミングエラー」に大きな「タイミングエラー」よりもペナルティを課さない累積的な予測と要求に依存するエラーメジャーについてのアイデアがあります。tt+1
Stephan Kolassa
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.