いわゆる断続的な需要、つまり「多くの」ゼロを特徴とする需要時系列があります。(時系列自体が需要ではない場合でも、以下のほとんどが当てはまります。)したがって、「断続的な需要を予測する」というWeb検索はすでに役に立ちます。Teunter and Duncan(2009、JORS)は、断続的な需要予測方法の概要を説明しています。
断続的な需要を予測する標準的な方法は、クロストンの方法です。デマンドインターバルとゼロ以外のデマンドサイズに個別に指数平滑法を使用します。その場合、ポイント予測は、平滑化されたゼロ以外の需要と平滑化された需要間間隔の比率です。SyntetosとBoylan(2001、IJPE)は、クロストンはわずかに偏っており、修正を提案していると述べていますが、これは通常、実際にはそれほど大きな違いはありません。
別の方法は、標準のARIMA時系列モデルを変更する整数自己回帰移動平均モデル(INARMA)です。マリアム・モハマディプールはこれらについて論文を書いた。
私は個人的に、このような期待値予測の有用性について大きな疑問を抱いています。他の期間ごとに1デマンドの時系列は、0.5の期待値を持っています... 4番目の期間ごとに2デマンドの時系列と同様に...以下同様ですが、ポアソンyはますます少なくなります。需要の将来(および予測)の分布全体を理解する方がはるかに有用だと私は主張します。予測間隔を探していることに拍手を送ります!
ただし、見つけた式は、ARIMAモデルを介した連続データの単一指数平滑化にのみ適用されます。SESが最適です。したがって、データをカウントすることはできません。むしろ、ポイント予測を取り、パラメータポアソン分布の分位数を使用することをお勧めします。これは依然としてパラメーター推定の不確実性(モデル選択の不確実性などと共に)を無視しますが、それは単純な可能性であり、おそらくあなたが持っている公式よりも優れています。α (n − 2 )y^λ = y^
Shenstone and Hyndman(2005、JoF)は、Crostonの方法が最適である一貫した確率モデルは存在しないことに注意してください。すべての候補モデルは(1)連続ではなく離散であり、(2)負の値を生成する可能性があります。ただし、これらの候補モデルについては、ShenstoneとHyndmanが予測区間を提供します。
最後に注意が必要です。特に断続的な要求ではなく、MADを使用してカウントデータ予測の精度を評価しないでください。期待MADをすることによって最小化された中央値のない、あなたの将来の分布の平均値、およびあなたがあなたのデータの65%がゼロであることを記述した場合、中央値はゼロです...あなたはおそらくフラットで最低のMADを取得することを意味しています予測がゼロであり、バイアスが大きく、おそらく役に立たない。これは、昨年の国際予測シンポジウムでこの問題について発表したプレゼンテーションです。またはMorlidge(2015、Foresight)をご覧ください。
恥知らずな自己宣伝の最後の部分:私はIJF(Kolassa、2016年)に、ポアソンモデルのさまざまなフレーバーを含む、さまざまな精度測定とさまざまな予測方法で、低ボリュームカウントデータ(大部分は断続的)を予測する記事を掲載しています。これは役立つかもしれません。