Googleトレンドは週次データを返すため、日次/月次データとそれらをマージする方法を見つける必要があります。
これまでに行ったことは、たとえば、各セリエを日次データに分割することです。
から:
2013-03-03-2013-03-09 37
に:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
しかし、これは私の問題に多くの複雑さを加えています。私は過去6か月の値、または月次データの6つの値からGoogle検索を予測しようとしていました。日次データは、180の過去の値に対する作業を意味します。(私は10年のデータを持っているので、月次データで120ポイント/週次データで500+ /日次データで3500+)
もう1つのアプローチは、日次データを週次/月次データに「マージ」することです。しかし、このプロセスからいくつかの疑問が生じます。合計が何かを表すため、一部のデータは平均化できます。たとえば、降雨量は、特定の週の雨量は、週を構成する各日の量の合計になります。
私の場合、私は価格、金融レートなどを扱っています。価格については、私の分野では交換された量を考慮することが一般的であるため、週次データは加重平均になります。財務レートの場合は少し複雑ですが、日次レートから週次レートを作成するためのいくつかの式が含まれています。その他については、基になるプロパティがわかりません。これらの特性は、無意味な指標を回避するために重要だと思います(たとえば、フィアンシャルレートの平均は意味をなさないでしょう)。
したがって、3つの質問:
既知のプロパティと不明なプロパティの場合、日次から週次/月次のデータにどのように進むべきですか?
実生活では意味のない量を導入しているため、毎週/毎月のデータをこれまでのように毎日のデータに分割するのは少し間違っているように感じます。だからほとんど同じ質問:
既知および未知のプロパティについて、毎週/毎月のデータから毎日のデータにどのように進むべきですか?
最後に重要なことですが、タイムステップが異なる2つの時系列が与えられた場合、何が良いですか:最小または最大のタイムステップを使用しますか?これはデータの数とモデルの複雑さの間の妥協点だと思いますが、これらのオプションから選択する強い議論はありません。
編集:簡単に実行できるツール(R PythonではExcelでも)を知っている場合は、大変助かります。