非負のスパース時系列データの予測


7

時間の経過に伴う顧客への製品の販売を表す時系列データセット(毎日の頻度)があります。売上は次のように表されます。

[00002400000004000017000090]

ここで、各数値は1日の製品の売上を表します。

問題は、時系列予測メソッド(ARMA、HoltWinters)が「連続的」で「滑らかな」データに対して適切に機能することですが、この場合は良い結果が得られません。

(1)負でない値の保証と(2)疎/非連続データの2つの点に注意して、そのシリーズを予測したいと思います。誰もがこの問題に取り組む方法を知っていますか?どのような方法/テクニック?

ありがとう!


思いがけずに、予測で毎日の解決が必要ない場合は、おそらく週ごとに集計することで、予測しやすい時系列になります。
フアン

回答:


3

私はここに2つのアイデアを持っています。おそらくそれらは役に立つでしょう。

アイデア1:イベント間の時間をモデル化する

データは2つのプロセスによって生成されたものと考えるかもしれません。最初のプロセスは時間間隔の分布であり、2番目は購入金額の分布です。したがって、データをモデル化するには、データセット内の非ゼロ値に対して1つの分布(ガウス?)を作成し、ゼロのシーケンスの長さ(ポアソン?)に対して別の分布を作成します。

アイデア2:モデル顧客の在庫

データセット内の販売イベントはまばらですが、顧客が購入したときに購入する理由のモデルを思いつくために少し時間を費やすことができます。考えられる1つのモデルでは、顧客の在庫が時間とともに縮小し、在庫が最小しきい値を超えたときに購入します。販売データを使用して、スロープ(線形収縮の場合)またはレート(指数収縮の場合)、およびしきい値に適合させることができます。

このモデルの顧客は異なるしきい値や異なる収縮率を持っている可能性があるため、これは任意に複雑になる可能性があります。


答えてくれてありがとう、@ lmjohns3!実際、私が今日心に留めていることは、あなたが提案したものと非常によく似ています。(1)ポアソンプロセスを使用して、購入履歴に基づいて顧客消費をモデル化します。(2)この値を予測します。(3)ポアソンプロセスを使用して、購入行動をモデル化します。他にご提案がございましたら、お知らせください。
ベルナルドアフラロ2017

1

このタイプのデータでは、情報は2つの場所から取得されます

  1. 販売時間間隔:と時間間隔TSale1Sale
  2. 額:SaleY

以前の回答と同様に、潜在的なパターンの時間間隔を確認することから始めることをお勧めします。2つ目は、を販売額と、の関係を確認することです。最も一般的なケースでは、これら2つは相関しているはずです。これに基づいて、それらを独立してモデリングするか、共同でモデリングするかを決定できます。一般的に使用されるモデルの1つは、状態空間モデルです。ここでの基本的な考え方は、スパースtsをスパースではなく、モデリングが容易なサブコンポーネントに分解することです。YY1TT1

一般的なモデルは次のとおりです。

T=gT1Y1+e

Y=fY1T+h

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.