時系列分析のポイントは何ですか?


29

時系列分析のポイントは何ですか?

回帰や機械学習など、明らかなユースケースを持つ統計方法は他にもたくさんあります。回帰は2つの変数間の関係に関する情報を提供しますが、機械学習は予測に最適です。

しかしその間、私は時系列分析が何のために良いかわかりません。確かに、ARIMAモデルを当てはめて予測に使用できますが、その予測の信頼区間が大きくなるとしたら何が良いでしょうか?世界史上最もデータ主導型の業界であるにもかかわらず、誰も株式市場を予測できない理由があります。

同様に、プロセスをさらに理解するためにどのように使用しますか?確かに、ACFをプロットして、「あぁ!依存関係があります!」と言うことができますが、その後はどうでしょうか。ポイントは何ですか?もちろん、依存関係があります。そのため、そもそも時系列分析を行っています。あなたはすでに依存があることを知っていました。しかし、あなたは何のためにそれを使用するつもりですか?


13
財務と経済以外に、うまく機能する他のユースケースがあります。
user2974951

29
他の統計的手法や機械学習手法を使用しても株式市場を予測することはできません。
ティム

16
ARIMAは回帰の形式ではないことを暗示しているようです。そうです。
Firebug

10
答えが専門家に明らかである場合でも、これは良い質問だと思います。
GUNG -復活モニカ

6
@gungと他の人とは違うようにお願いします。研究努力の最小量がそれに答えるからです。
whuber

回答:


54

主な用途の1つはです。私は、スーパーマーケットが明日販売する特定の製品のユニット数を予測することで、10年以上家族に食事を提供しています。これにはお金があります。

その他の予測ユースケースは、International Journal of ForecastingまたはForesightのような出版物に記載されています。(完全開示:私はForesightのアソシエイトエディターです。)

はい、時々、は巨大です。(ではなくPIを意味すると仮定します。違いがあります。)これは、プロセスの予測が難しいことを意味します。次に、緩和する必要があります。スーパーマーケットの売上予測では、これは多くの安全在庫が必要であることを意味します。海面上昇の予測では、これはより高い堤防を建設する必要があることを意味します。大きな予測間隔は有用な情報を提供すると言えるでしょう。

また、予測はより大きなトピックですが、すべての予測ユースケースで分析が役立ちます。多くの場合、時系列の依存関係を考慮することで予測を改善できます。そのため、依存関係が存在することを知るだけでなく、分析を通じてそれらを理解する必要があります。

さらに、人々は予測しなくても時系列に興味があります。計量経済学者は、マクロ経済時系列の変化点を検出することを好みます。または、税法の変更などの介入がGDPなどに与える影響を評価します。お気に入りの計量経済学のジャーナルをざっと読んで、もっとインスピレーションを得たいと思うかもしれません。


14
+1。他の場所でも役立ちます。時系列分析を行うと、関心のある結果に影響を与えるイベント(あなたは知らなかった)を確実に警告します。私と私の同僚全員は、火曜日の朝の製品化学分析で一般にひどく悪いことに気付いて完全にcompletely然としました。私たちは、いくつかの弱点を抱えた、意図的なクリーニングスケジュールに戻って追跡しました。1年で100万ドル近く節約し、製品のppkを1.7から1.9に改善しました。学んだ教訓:変動フレーム化された問題について常に初歩的な時系列分析を行います。
スティアンYttervik

+1。@Stephan Kolassa、あなたの答えは、OPの質問の私の解釈である現実世界での予測の使用方法を強調しています。予測間隔のポイントと(半分の)長さは、緩和戦略の計画に重要な情報です。マンハッタンの洪水を防ぐために堤防を建設し、新しい時系列方法で予測間隔を十分に短縮する場合、必要なリソースのみを使用して堤防建設のコストを削減できます。必要な変更を加えて食料品の例を適用します。
ルーカスロバーツ

13

M. DettlingのレッスンスライドからのTS分析の目標:

1)探索的分析:シリーズのプロパティの視覚化

  • 時系列プロット
  • トレンド/季節パターン/ランダムエラーへの分解
  • 依存関係構造を理解するためのコレログラム

2)モデリング:シリーズの最も重要な特性を表し、反映するデータに確率モデルを適合させる

  • 探索的または事前の知識がある
  • モデルの選択とパラメーターの推定が重要です
  • 推論:モデルはどの程度データに適合していますか?

3)予測:不確実性の尺度による将来の観測の予測

  • 主にモデルベースで、依存関係と過去のデータを使用します
  • 外挿であるため、多くの場合、一粒の塩を使用します
  • リアウィンドウミラーを覗いて車を運転するのに似ています

4)プロセス制御:(物理)プロセスの出力は時系列を定義します

  • 確率モデルは観測データに適合します
  • これにより、信号とノイズの両方を理解できます
  • 正常な/異常な変動を監視することが可能です

5)時系列回帰:1つ以上の入力系列を使用して応答時系列をモデリングし、このモデルをiidエラー仮定の下で近似します。

  • 公平な見積もりにつながりますが、...
  • ひどく間違った標準エラー
  • したがって、信頼区間とテストは誤解を招く

在庫マーク付きの問題について:

  • これらのTSは非常に揮発性であり、モデル化は困難です。
  • たとえば、会社に関する法律の変更は、TSプロセスの変更につながる可能性があります。統計ツールはどのようにそれを予測しますか?

シリアル相関について:

  • 多変量統計とは対照的に、時系列のデータは通常iidではなく、連続的に相関しています。
  • この情報は、たとえば汚れた実験器具のように、iidではない何か、あるべきものを検出するのにも役立ちます。

1
分類を追加します。たとえば、携帯電話の加速度計データの分析に基づいてアクティビティを認識するアプリが多数あります。
SaiBot

それは面白い!これどうやってやるの?
ニコールオリガミフォックス

1
いろいろな方法があると思います。1つの方法は、アクティビティにラベルを付けてユーザーにトレーニングデータを生成させることです。それができたら、時系列を(重複する)間隔(3秒など)で切り取り、機械学習モデルをトレーニングできます。その後、ラベルのないアクティビティを分類できます。
SaiBot

サイボットありがとうございます。なるほど、さまざまなツールの組み合わせをより頻繁に検討する必要があります:)
ニコールオリガミフォックス

11

質問に答える最も簡単な方法は、大まかに言って、データセットが大まかに断面時系列、およびパネルに分類されることを理解することです断面回帰は、断面データセットの重要なツールです。これは、ほとんどの人が用語リグレッションで知っており、参照しているものです。時系列回帰は時系列に適用されることもありますが、時系列分析には回帰以外の幅広いツールがあります。

バツ1y1バツ2y3バツnynバツyyバツy^バツ

ここに画像の説明を入力してください

サンプルがランダムでない場合、回帰はまったく機能しない可能性があります。たとえば、モデルを推定するために1年生の女の子のみを選択しましたが、12年生の男性の身長を予測する必要があります。そのため、クロスセクションの設定でも、回帰には独自の問題があります。

バツtytバツ1y1バツ2y3バツnyntバツy

ここに画像の説明を入力してください

t

3番目の一般的なデータセットタイプはパネル、特に1番目の縦断データです。ここでは、多くの生徒の体重と身長の変数のスナップショットをいくつか取得できます。このデータセットは、断面のまたは一連の時系列のように見える場合があります。

ここに画像の説明を入力してください

当然、これは以前の2つのタイプよりも複雑になる可能性があります。ここでは、パネル回帰と、パネル用に開発されたその他の特別な手法を使用します。

要約すると、時系列回帰が断面回帰と比較して別個のツールと見なされる理由は、時系列が回帰手法の独立仮定に関して固有の課題を提示するためです。特に、断面分析とは異なり、観察の順序が重要であるという事実により、通常、あらゆる種類の相関および依存構造につながり、回帰技術の適用が無効になる場合があります。依存関係に対処する必要があり、それこそが時系列分析が得意なことです。

資産価格の予測可能性

また、株式市場と資産価格についての一般的な誤解を繰り返していますが、それらは予測できません。この声明は一般的すぎて真実ではありません。AAPLの次のティックを確実に予測できないことは事実です。ただし、これは非常に狭い問題です。ネットをより広くキャストすると、あらゆる種類の予測(および特に時系列分析)で収益を上げる多くの機会が見つかります。統計的裁定取引はそのような分野の1つです。

さて、資産価格が短期的に予測することが難しい理由は、価格変化の大きな要素が新しい情報であるという事実によるものです。過去から現実的に考案できない真に新しい情報は、定義上、予測することは不可能です。しかし、これは理想化されたモデルであり、多くの人々は、状態の持続を可能にする異常が存在すると主張します。これは、価格変更の一部が過去によって説明できることを意味します。このような場合、時系列分析は永続性を正確に処理するため、非常に適切です。新しいものを古いものから分離し、新しいものを予測することは不可能ですが、古いものは過去から未来へと引きずられます。あなたも少し説明することができた場合は、金融にそれはあなたがいることを意味してもよいですお金を稼ぐことができます。そのような予測に基づいて構築された戦略の価格が、それによって生み出された収入をカバーしている限り。

最後に、2013年の経済学ノーベル賞をご覧ください。「今後3年から5年などの長期にわたるこれらの価格の広範な推移を予測することは非常に可能です。」Shillerのノーベル講義を見て、彼は資産価格の予測可能性について議論しています。


6

時系列分析は、時間データでの効果的な異常または異常値の検出にも役立ちます。

例として、ARIMAモデルを近似し、予測間隔を計算することができます。ユースケースに応じて、間隔を使用してしきい値を設定できます。しきい値内では、プロセスが制御されていると言えます。新しいデータがしきい値を超えた場合、さらに注意を引くためにフラグが立てられます。

このブログ投稿には、異常値検出のための時系列分析の概要が簡潔にまとめられています。より詳細な治療のために、ebayの研究者は、時系列データの統計分析に基づいて大規模に異常検出を実行した方法を説明します。


6

回帰や機械学習など、明らかなユースケースを持つ統計方法は他にもたくさんあります。回帰は2つの変数間の関係に関する情報を提供しますが、機械学習は予測に最適です。

あなたは、以下のあなた自身の質問に答えます:自己相関。通常、時系列にはそれがあり、基本的なOLS回帰の仮定に違反しています。時系列手法には、時系列に対して適切な仮定があります。

リカレントニューラルネットワーク(RNN)や1-D畳み込みニューラルネットワーク(CNN)など、シーケンシャルデータを処理する機械学習法は特殊化されているため、時系列に特化した手法を使用できます。

しかしその間、私は時系列分析が何のために良いかわかりません。確かに、ARIMAモデルを当てはめて予測に使用できますが、その予測の信頼区間が大きくなるとしたら何が良いでしょうか?世界史上最もデータ主導型の業界であるにもかかわらず、誰も株式市場を予測できない理由があります。

時系列手法から生じる信頼区間(CI)は、非時系列回帰からのものよりもおそらく大きくなります。この機能は正確であると知られています。一般に、非時系列回帰を使用する場合、CIは小さくなりますが、その前提に違反しているため間違っています。必要なことは、小さいCIでグラフを作成するか、CIを完全にスキップすることですが、適切なCIが必要な場合は適切な手法を使用します。

株式市場は、その性質上、予測が困難です。他の時系列ははるかに予測可能です。株式市場で選択した機械学習手法を使用してみてください。あなたはより多くの成功を収めることができないでしょう。

同様に、プロセスをさらに理解するためにどのように使用しますか?確かに、ACFをプロットして、「あぁ!依存関係があります!」と言うことができますが、その後はどうでしょうか。ポイントは何ですか?もちろん依存関係があります。そのため、そもそも時系列分析を行っています。あなたはすでに依存があることを知っていました。しかし、あなたは何のためにそれを使用するつもりですか?

予測する。季節性を見るために。異なる季節にわたるデータの変動性についてのアイデアを持っています。言うまでもなく、State Spaceメソッドなど、従来のARIMAよりも強力な時系列テクニックがあります。ARIMAは時系列のモデリングに最適な手法ではありません。(実際、選択した統計ソフトウェアのARIMA手順は、おそらく内部で状態空間表現を使用しています。)


5

redhqsによる異常検出の回答に色を追加するために、職場で販売やトラフィックフローなどの運用メトリックの異常検出モデルを構築します。時系列分析を行って、すべてが期待どおりに機能している場合の売上がどうあるべきかを理解し、それらを観測値と比較して、Webサイトが壊れているかどうかを確認します。サイトがダウンしている毎分、私たちは多くのお金を失っているので、それは重要です。

使用できるさまざまな方法があり、多くの場合、さまざまな方法がさまざまなことを達成しようとします。たとえば、販売異常の検出に使用した主な統計手法は「STL」(黄土を使用した季節トレンド分解)と呼ばれます。これにより、通常の季節性、傾向、およびランダムノイズが分離されます。実際にこれを使用して、毎日と毎週の季節性を識別します。次に、ノイズを排除し、傾向/季節性を組み合わせて、予想される売上を推定します。そのため、このケースでは、アプローチを使用して、売上が時間帯や時間帯によってどのように変化するかを理解し、ランダムノイズを推定値から除​​外します。


SARIMA prtionと検出されるのを待っている介入構造(パルス、レベル/ステップシフトの両方を同時に識別できるように明示的に許可するモデル識別戦略とは対照的に、異常がないと推定される時系列モデルを構築するようです。 、季節パルス、現地時間の傾向)
IrishStat

STLアルゴリズムには堅牢性フラグがあります(平滑化ループの反復回数を制御します)。とにかく私たちの時系列に対して非常にうまく機能します。
ウィリーウィーラー

検出されるのを待っている決定論的な構造が存在する場合、反復の数はモデル形式のバイアスを処理しません。
IrishStat

3

他の人から提供された優れた回答に加えて、電気工学で時系列分析がどのように使用されているかについてコメントしたいと思います。

電気工学の大部分は、電圧と電流を変調して情報を送信するか、センサーを使用して物理的な信号(音波など)を電気的な形に変換することで構成されます。アナログ-デジタル(A / D)コンバーターは、これらの信号を等間隔(時間内)の離散サンプルのセット、または時系列に変換します!時系列分析方法は、ほとんどすべての最新の信号処理アルゴリズムの基礎です。

たとえば、音声処理では、マイクを使用して音波を電圧に変換し、A / Dでサンプリングし、その後に信号の時系列モデルを作成します。例えば、携帯電話の線形予測コーダー(LPC)は、話されている単語のARMAモデルを作成し、データサンプル自体ではなく、モデル係数を(事前定義された辞書からの励起信号を表すインデックスとともに)送信します。データ圧縮。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.