タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

2
時系列分析を使用して暴力的な行動を分析/予測する
これはちょっとした質問ですが、私はその答えに真剣に興味を持っています。私は精神病院で働いており、その病棟での暴力のレベルに関して各病棟で毎日収集された3年間のデータを持っています。 明らかに、これらのデータに適合するモデルは時系列モデルです。スコアをより正常にするために、スコアを変える必要がありました。ARMAモデルを差分データで近似します。最適なのは、遅延2で1度の差分と1次の自己相関があるモデルだと思います。 私の質問は、このモデルをいったい何のために使用できるのかということです。時系列は、うさぎの個体数と原油価格に関する教科書では常に非常に有用に思えますが、今では自分でやった結果は非常に抽象的で完全に不透明に見えます。差のあるスコアは2ラグで互いに相関していますが、深刻な問題が発生した2日後にすべての人が高度に警戒するようにアドバイスすることはできません。 または私はできますか?

5
予測に複数のモデルを使用する場合
これはかなり一般的な質問です。 私は通常、複数の異なるモデルを使用すると、サンプルから時系列を予測しようとするときに1つのモデルよりも優れていることを発見しました。モデルの組み合わせが単一のモデルよりも優れていることを示す良い論文はありますか?複数のモデルを組み合わせるのにベストプラクティスはありますか? いくつかの参照: Hui Zoua、Yuhong Yang 「予測のための時系列モデルの組み合わせ」 International Journal of Forecasting 20(2004)69– 84

4
ラグと時系列のある多重線形回帰の「機械的な」違いは何ですか?
私は現在、データ工学の修士号を取得するために勉強しているビジネスと経済学を卒業しています。線形回帰(LR)を研究してから、時系列分析(TS)を研究しているときに、疑問が浮かびました。多重線形回帰を使用し、それにラグ変数を追加するのではなく、時系列(ARIMA)などのまったく新しいメソッドを作成する理由(ラグの順序はACFとPACFを使用して決定)?そこで、先生は私がこの問題について少しエッセイを書くことを提案しました。私は手ぶらで助けを求めに来ませんでしたので、私はこのトピックに関する研究を行いました。 LRを使用する場合、ガウスマルコフの仮定に違反すると、OLS回帰は正しくないこと、そしてこれは時系列データ(自己相関など)を使用するときに発生することを既に知っていました。(これに関する別の質問、GMの仮定の1つは、独立変数を正規分布させるべきか、それとも独立変数の条件付き従属変数だけかということです。) また、ここで提案している分散ラグ回帰を使用し、OLSを使用してパラメーターを推定すると、変数間の多重共線性が(明らかに)発生する可能性があるため、推定が間違っていることもわかっています。 でTSとLRについて同様のポストここで、@IrishStatは言いました: ...回帰モデルは、動的回帰モデルまたはXARMAXモデルとも呼ばれる伝達関数モデルの特定のケースです。際立ったポイントは、時系列でのモデルの識別、つまり、適切な違い、Xの適切なラグ、適切なARIMA構造、パルスなどの不特定の決定論的構造の適切な識別、レベルシフト、ローカル時間傾向、季節的パルス、および組み込みです。パラメータの変化またはエラー分散を考慮する必要があります。 (私はBox JenkinsとLRについてのAutoboxの彼の論文も読んでいます。)しかし、これでも私の疑問は解決しません(または、少なくとも私にとってRLとTSの異なるメカニズムを明確にしません)。 遅れた変数でもOLS問題が発生し、効率的でも正確でもないことは明らかですが、最尤法を使用する場合、これらの問題は持続しますか?ARIMAは最尤法で推定されることを読んだので、遅れのあるLRがOLSではなくMLで推定される場合、「正しい」係数が得られます(順序のMAのように、遅延誤差項も含めると仮定します) q)。 要するに、問題はOLSですか?MLを適用して問題は解決しましたか?

2
日次データの重回帰で季節性をキャプチャする
季節性の高い製品の毎日の販売データがあります。回帰モデルで季節性をキャプチャしたい。四半期または毎月のデータがある場合、それぞれ3と11のダミー変数を作成できますが、毎日のデータを処理できますか? 3年間の毎日のデータがあります。独立変数は、価格、販促フラグ(yes / no)、および温度です。従属変数は、その製品の販売です。重回帰モデルを使用しているため、時系列モデルを探していません。

3
残差自己相関とラグ付き従属変数
時系列をモデル化するとき、(1)AR(1)プロセスなどのエラー項の相関構造をモデル化する可​​能性があります(2)説明変数として遅延従属変数を含む(右側) 私は彼らが(2)に進むべき実質的な理由であることを理解しています。 ただし、(1)または(2)のいずれか、あるいはその両方を行う方法論的な理由は何ですか?

1
自己相関の解釈方法
魚の動きのパターンに関する時系列データの自己相関を、その位置に基づいて計算しました:X(x.ts)およびY(y.ts)。 Rを使用して、次の関数を実行し、次のプロットを作成しました。 acf(x.ts,100) acf(y.ts,100) 私の質問は、これらのプロットをどのように解釈すればよいですか?あらゆる種類のパターンを報告するには、どのような情報が必要ですか?私はインターネットをサーフィンしてきましたが、それを効果的に説明する簡潔な方法をまだ見つけていません。 また、使用するラグの正しい量をどのように決定しますか?100を使用しましたが、多すぎるかどうかはわかりません。

4
応答変数が年間イベント(通常)が発生する年の日である回帰モデル
この特定のケースでは、湖が凍る日を指しています。この「アイスオン」の日付は年に1回だけ発生しますが、まったく発生しない場合もあります(冬が暖かい場合)。そのため、1年で湖は20日目(1月20日)に凍結する可能性があり、もう1年でまったく凍結しない可能性があります。 目標は、着氷日のドライバーを把握することです。 予測因子は、毎年秋/冬の気温などです。年は、長期的な線形トレンドの予測因子になる可能性があります。 1)整数の「年の日」は妥当な応答変数ですか(そうでない場合は何ですか?)? 2)湖が凍らない年をどう扱うべきか? 編集: ここにエチケットが何であるかはわかりませんが、受け取った提案の結果を投稿すると思いました。こちらが論文、オープンアクセスです。@pedrofigueiraと@cboettigに感謝します。もちろん、エラーは私自身のものです。

1
モデルが同じデータセットに基づいている限り、AIC値を比較できますか?
Rob Hyndmanの予測パッケージを使用して、Rで予測を行っています。パッケージに属する論文はここで見つけることができます。 この論文では、自動予測アルゴリズムについて説明した後、著者は同じデータセットにアルゴリズムを実装しています。ただし、指数平滑法とARIMAモデルの両方を推定した後、私は理解できないステートメントを作成します(17ページ): 情報の基準は比較できないことに注意してください。 モデルの選択にAICを使用する利点は、同じデータセットを使用して推定される限り、異なるモデルのAIC値を比較できることだと思いました。これは間違っていますか? いわゆる赤池重みを使用して異なるモデルクラス(指数平滑法やARIMAなど)からの予測を結合することを計画していたため、この問題は私にとって特に興味深いです(赤池重みについてはBurnham and Anderson、2002を参照) 参照資料 バーナム、KP、およびアンダーソン、DR(2002)。モデル選択とマルチモデル推論:実用的な情報理論的アプローチ。スプリンガー出版。

1
Rのplot.stlの範囲バーを解釈しますか?
範囲バーのplot.stl正確な意味を理解するのに苦労しています。この質問に関するGavinの投稿を見つけ、ドキュメントも読んで、分解されたコンポーネントの相対的な大きさを伝えることを理解していますが、それでもそれらがどのように機能するかは完全にはわかりません。 例えば: データ:小さなバー、スケールなし季節的:フルバー、スケールが-0.6から0.2の範囲トレンド:別の小さなバー(データと等しいと思われる)、スケールなし残り:スケールが-1.5から0.5の中サイズのバー 関係の基礎が何であるか、なぜトレンドに規模がないのかはわかりません。私が試したstlとdecompose乗法と加法方法で同一の結果に。
13 r  time-series 

1
時系列で分析の単位(集計レベル)をどのように選択しますか?
観測の時系列を任意のレベルの精度で測定でき、調査の目標がXとYの関係を特定することである場合、特定のレベルの集約を別の集約よりも選択するための経験的な正当化がありますか?選択は、理論および/または実際の制限に基づいて単純に行われますか? このメインの質問には3つのサブ質問があります。 XまたはYの任意の非ランダムな変動は、より小さなレベルの集約を選択するのに十分な理由付けになりますか(非ランダムな観測の一時的なパターン)。 XとYの関係の変化は、より小さな分析単位を正当化するために、より小さなレベルの集約で十分ですか?ある程度の変動が許容される場合、どの程度の変動が大きすぎるかをどのように判断しますか? 人々は、経験的理由または理論的理由のいずれかで、ある分析単位が別の分析単位よりも説得力がある/明確に定義されていると主張することができますか? 空間解析における修正可能な面積単位の問題をよく知っています(Openshaw 1984)。私はその材料の専門家であると主張していませんが、これまでのところ、生態学的な誤lessを犯す可能性が低いため、分析の単位が小さい方が常に良いと思うだけです(Robinson 1950)。地理的単位の集約に関して直接関連する参照または回答がある場合は、その回答も歓迎します。

2
イベント時間に関する不確実性を伴う時系列のイベントに対する評価者間の信頼性
時系列でイベントを識別しようとする複数の独立したコーダーがいます-この場合、対面の会話のビデオを見て、特定の非言語的行動(たとえば、頭のうなずき)を探し、それぞれの時間とカテゴリをコーディングしますイベント。このデータは、高いサンプリングレート(30フレーム/秒)の離散時系列または連続時系列のどちらかが扱いやすい方として合理的に扱うことができます。 評価者間信頼性の尺度を計算したいのですが、イベントがいつ発生したかについて不確実性があると予想しています。つまり、たとえば、あるコーダーが、他のコーダーが考えていたよりも4分の1秒遅れて特定の動きが始まったことをコーディングすることを期待しています。これらが役立つ場合、これらはまれなイベントです。通常、イベント間で少なくとも数秒(数百のビデオフレーム)。 これらの種類の同意と不一致の両方に注目する評価者間信頼性を評価する良い方法はありますか?(1)評価者は、発生したイベント(ある場合)に同意しますか?(2)発生時に同意しますか?後者は私にとって重要です。なぜなら、私はこれらのイベントのタイミングを、人々が何を言っているかなど、会話で起こっている他の事柄と比較して見ることに興味があるからです。 私の分野での標準的な実践は、物事をタイムスライス、たとえば1/4秒程度に分割し、各コーダーがタイムスライスごとに報告するイベントを集計してから、コーエンのカッパまたは同様の尺度を計算することです。しかし、スライスの継続時間の選択はアドホックであり、イベントの時間の不確実性についてはよくわかりません。 私がこれまでに持っていた最も良い考えは、ある種の信頼性曲線を計算できるということです。2つのイベントが同時にコーディングされていると見なすウィンドウのサイズの関数としてのカッパのようなもの。でも、そこからどこに行くのかよく分からないけど...

6
突然の変化を特徴付ける方法は?
この質問は基本的すぎるかもしれません。データの時間的傾向について、「急激な」変化が起こるポイントを知りたい。たとえば、下の最初の図では、統計的方法を使用して変化点を見つけたいと思います。そして、変化点が明らかでない他のデータ(2番目の図のような)にそのような方法を適用したいのですが、そのような目的のための一般的な方法はありますか?

3
アンサンブル時系列モデル
時系列予測を自動化する必要がありますが、それらの系列の機能(季節性、傾向、ノイズなど)を事前に知りません。 私の目的は、各シリーズに最適なモデルを取得することではなく、かなり悪いモデルを回避することです。言い換えれば、小さなエラーを毎回取得することは問題ではありませんが、大きなエラーを時々取得することは問題です。 異なる手法で計算されたモデルを組み合わせることで実現できると思いました。 つまり、ARIMAは特定のシリーズに最適なアプローチですが、別のシリーズには最適でない場合があります。指数平滑法についても同様です。 ただし、各手法の1つのモデルを組み合わせると、1つのモデルがそれほど良くなくても、もう1つのモデルが推定値を実際の値に近づけます。 ARIMAが長期の正常に動作するシリーズに適していることはよく知られていますが、指数平滑法は短期のノイズの多いシリーズで際立ちます。 私のアイデアは、より堅牢な予測を得るために、両方の手法から生成されたモデルを組み合わせることです、それは理にかなっていますか? これらのモデルを組み合わせるには多くの方法があるかもしれません。 これが良いアプローチである場合、それらをどのように組み合わせる必要がありますか? 予測の単純な平均はオプションですが、モデルの適切な尺度に従って平均に重みを付けると、より良い予測が得られる可能性があります。 モデルを組み合わせるときの分散の扱いは何ですか?

1
複数の時系列データでLSTMモデルをトレーニングする方法は?
複数の時系列データでLSTMモデルをトレーニングする方法は? 使用例:過去5年間、毎週20,000人のエージェントの売上があります。各エージェントの今後の週次売上を予測する必要があります。 バッチ処理手法に従う必要がありますか?一度に1つのエージェントを取得し、LSTMモデルをトレーニングしてから予測しますか?もっと良い方法は?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.