回答:
あなたは素晴らしいstl()
方法を試すことができます-それは(反復loess()
フィッティングを使用して)トレンドと季節と残りに分解します。これはここであなたの振動を拾うかもしれません。
振動の周波数がわかっている場合は、2つの追加の予測子、sin(2πwt)とcos(2πwt)を含めることができます(wを設定して目的の波長を取得します)。これにより、振動がモデル化されます。振幅と位相角を合わせるには両方の項が必要です。複数の周波数がある場合は、各周波数にサインとコサインの項が必要です。
周波数が何であるかわからない場合、複数の周波数を分離する標準的な方法は、データをトレンド除去し(あなたが行ったように線形フィットから残差を取得する)、残差に対して離散フーリエ変換を実行することです。これをすばやく簡単に行うには、MS-Excelを使用します。MS-Excelには、データ分析アドインにフーリエ分析ツールがあります。残差に対して分析を実行し、変換の絶対値を取得し、結果を棒グラフにします。ピークは、モデリングする主要な周波数成分になります。
これらの循環予測変数を追加するときは、回帰のp値に細心の注意を払い、過剰適合しないでください。統計的に有意な頻度のみを使用してください。残念ながら、これにより低周波の調整が少し難しくなる場合があります。
これらのデータに適合する通常の最小二乗法が不適切である可能性が高いことを観察することから始めましょう。累積される個々のデータが、通常どおり、ランダムなエラー成分を持つと仮定される場合、累積データのエラー(累積頻度ではなく、それはあなたが持っているものとは異なる)はすべてのエラー項の累積合計です。これにより、累積データは不均一になり(時間の経過とともにますます変動するようになります)、強く正の相関があります。これらのデータは非常に規則正しく動作し、それらのデータが非常に多いため、近似にはほとんど問題がありません。 エラーは推定されますが、予測、予測(これが問題です)、特に予測の標準エラーは大幅に減少する可能性があります。
そのようなデータを分析するための標準的な手順は、元の値から始まります。日々の差を取り、より高い周波数の正弦波成分を除去します。週ごとの違いを考慮して、可能な週ごとのサイクルを削除してください。残っているものを分析します。 ARIMAモデリングは強力で柔軟なアプローチですが、単純に開始します。これらの異なるデータをグラフ化して、何が起こっているかを確認し、そこから先に進みます。また、2週間未満のデータでは、週ごとのサイクルの推定値が低くなり、この不確実性が予測の不確実性を支配することに注意してください。