タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

1
lmerモデルに使用する多重比較方法:lsmeansまたはglht?
1つの固定効果(条件)と2つのランダム効果(被験者内のデザインとペアによる参加者)を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 次に、固定効果(条件)のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。 私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

5
何回もシリーズを同時に処理する方法は?
25期間のいくつかの製品(1200製品)の需要を含むデータセットがあり、次の期間の各製品の需要を予測する必要があります。最初は、ARIMAを使用して各製品のモデルをトレーニングしたかったのですが、製品の数と(p、d、q)パラメーターの調整のため、非常に時間がかかり、実用的ではありません。以前の要求が独立変数である回帰(自己回帰)を使用することをお勧めしますか? 1200のすべての製品の需要予測のために単一のモデルをトレーニングする方法があるかどうかを知ることができますか?Pythonを使用しているので、Pythonのライブラリを提案していただければ幸いです。


3
RNNで時系列に逆伝播するのはなぜですか?
リカレントニューラルネットワークでは、通常、いくつかのタイムステップを順方向に伝播し、ネットワークを「展開」してから、入力シーケンス全体に逆方向に伝播します。 シーケンスの個々のステップごとに重みを更新しないのはなぜですか?(切り捨ての長さ1を使用するのと同じで、展開するものは何もありません)これにより、消失勾配の問題が完全に排除され、アルゴリズムが大幅に簡素化され、おそらくローカルミニマムで動けなくなる可能性が低くなり、最も重要なことにはうまく機能するようです。この方法でモデルをトレーニングしてテキストを生成しましたが、結果はBPTTトレーニングモデルで見た結果に匹敵するようでした。混乱しているのは、これまで見たRNNに関するすべてのチュートリアルが、BPTTを使用するように言っているからです。まるで適切な学習に必要であるかのように、そうではありません。 更新:回答を追加しました

5
時系列計量経済学とパネルデータ計量経済学の違いは何ですか?
この質問は非常に単純かもしれませんが、計量経済学の教え方は、時系列とパネルデータの方法に違いがある場合は非常に混乱しています。 時系列については、共分散定常、AR、MAなどのトピックを取り上げました。パネルデータについては、固定効果とランダム効果(または、より一般的には階層モデル)、差分の形式の議論しか見ていません。違いなど これらのトピックは何らかの形で関連していますか?パネルデータには時間ディメンションもあるため、なぜAR、MAなどの議論もないのですか? 答えがパネル手法に関する私の教育が単に不十分であるという場合、FE / RE、差の違い以上のものをカバーする本を指していただけますか?

1
指数平滑化モデルで欠損データを処理する
モデルの指数平滑化ファミリのコンテキストで欠損データを処理する標準的な方法はないようです。特に、予測パッケージのetsと呼ばれるR実装は、データが欠落することなく、最も長いサブシーケンスをとるように思われます。また、Hindman et alの「Forecasting with Exponential Smoothing」という本もそうです。欠落データについてはまったく話していないようです。 ユーザーが明示的に私に尋ねた場合(そして、不足しているデータが互いに近すぎたり、正確に1シーズン離れている期間にあまり発生しない場合)、もう少しやりたいと思います。特に、私が念頭に置いているのは以下です。シミュレーション中に、欠損値が発生するたびに、現在のポイント予測をに置き換えて、ます。これにより、たとえば、パラメータポイントの最適化プロセスでデータポイントが考慮されなくなります。〜Yトンytyty_ty~ty~t\tilde y_tytyty_tεt=0εt=0\varepsilon_t = 0 パラメーターの妥当な適合が得られたら、エラーの標準偏差(平均で正常と仮定)を推定し、その分布から生成された値を使用して尤度が大きく低下しないことを確認できます。私はそのような値を(シミュレーションを使用して)予測にも使用します。000ϵtϵt\epsilon_t この方法には落とし穴がありますか?

4
RのARIMA残差のLjung-Box統計:混乱したテスト結果
予測しようとしている時系列があり、そのために季節のARIMA(0,0,0)(0,1,0)[12]モデル(= fit2)を使用しました。Rがauto.arimaで提案したものとは異なります(Rで計算されたARIMA(0,1,1)(0,1,0)[12]の方がより適切であるため、fit1と名付けました)。ただし、時系列の最後の12か月では、モデル(fit2)を調整するとよりよくフィットするようです(慢性的に偏っていたため、残差平均を追加し、新しいフィットは元の時系列の周囲によりぴったりと収まるようです)過去12か月の例と、両方の近似の最近12か月のMAPEは次のとおりです。 時系列は次のようになります。 ここまでは順調ですね。私は両方のモデルの残差分析を実行しましたが、これが混乱です。 acf(resid(fit1))は素晴らしく、非常にホワイトノイズが多い: ただし、Ljung-Boxテストは、たとえば20のラグに対しては見栄えがよくありません。 Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1) 次の結果が得られます。 X-squared = 26.8511, df = 19, p-value = 0.1082 私の理解では、これは残差が独立していないことの確認です(p値が大きすぎて独立仮説を維持できない)。 ただし、ラグ1では、すべてが素晴らしいです。 Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1) 私に結果を与えます: X-squared = 0.3512, df = 0, p-value < 2.2e-16 テストを理解していないか、またはacfプロットで見たものとわずかに矛盾しています。自己相関は非常に低いです。 次に、fit2をチェックしました。自己相関関数は次のようになります。 いくつかの最初のラグでのこのような明らかな自己相関にもかかわらず、Ljung-Boxテストでは、fit1よりも20ラグではるかに良い結果が得られました。 Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0) 結果: X-squared = 147.4062, df = 20, p-value < 2.2e-16 一方、lag1で自己相関をチェックするだけで、帰無仮説の確認もできます。 Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0) X-squared = 30.8958, df …

1
ある時系列を別の時系列から予測する方法(関連している場合)
私はこの問題を一年以上解決しようとしてきましたが、あまり進歩していません。これは私が行っている研究プロジェクトの一部ですが、問題の実際の領域は少しわかりにくい(視線追跡)ので、作成したストーリーの例で説明します。 あなたは海を横断する敵船を追跡する飛行機なので、船の一連の(x、y、time)座標を収集しました。隠された潜水艦は船を保護するために船と一緒に移動しますが、その位置に相関関係がありますが、潜水艦はしばしば船から離れてさまよいます。そのため、しばしば潜水艦は近くにありますが、たまに世界。あなたは潜水艦の進路を予測したいのですが、残念ながらそれはあなたから隠されています。 しかし、4月の1か月間、潜水艦が自分自身を隠すのを忘れていることに気付くので、1,000回の航海を通じて潜水艦と船の両方の一連の座標があります。このデータを使用して、船の動きだけを考慮して、潜水艦の経路を予測するモデルを作成します。素朴なベースラインは「潜水艦の位置の推測=「船の現在の位置」と言うことですが、潜水艦が見える4月のデータから、潜水艦が少し船の前方にいる傾向があることに気づくでしょう。さらに、4月のデータは、船が長時間水に沈むと、潜水艦が沿岸水域をパトロールしている可能性が高いことを示しています。他のパターンもあります。もちろん。 4月のデータをトレーニングデータとして、このモデルをどのように構築して、潜水艦の進路を予測しますか?私の現在の解決策は、因子が「旅行時間」、「船のx座標」、「1日間船が遊休した」などのアドホック線形回帰であり、Rに重みを計算させ、相互検証を実行します。 。しかし、4月のデータからこれらの要因を自動的に生成する方法が本当に欲しいです。また、線形回帰はそうではなく、関連性があると思うので、シーケンスまたは時間を使用するモデルがいいでしょう。 これをすべて読んでくれてありがとう、私は何でも明確にしたいと思います。

2
金融/経済学研究における不規則な間隔の時系列
金融計量経済学の研究では、日次データの形をとる金融時系列間の関係を調査することは非常に一般的です。多くの場合、変数は対数の差を取ることによってになります。。私(0 )私(0)I(0)ln(Pt)− ln(Pt − 1)ln⁡(Pt)−ln⁡(Pt−1)\ln(P_t)-\ln(P_{t-1}) ただし、毎日のデータは、毎週データポイントがあり、土曜日と日曜日が欠落していることを意味します。これは、私が知っている応用文献では言及されていないようです。この観察から得られた私が持っているいくつかの密接に関連した質問はここにあります:555 週末に金融市場が閉鎖されたとしても、これは不規則な間隔のデータとみなされますか? もしそうなら、この問題を無視する膨大な数の論文でこれまでに得られた現存の経験的結果の妥当性に対する結果は何ですか?

1
時系列をリサンプリングするこの方法は文献で知られていますか?名前はありますか?
私は最近、時系列をリサンプリングする方法を探していました。 長いメモリプロセスの自己相関をほぼ維持します。 観測のドメインを保持します(たとえば、整数のリサンプリングされた時系列は、整数の時系列のままです)。 必要に応じて、一部のスケールのみに影響する場合があります。 長さ時系列に対して次の順列スキームを思い付きました。2N2N2^N 連続する観測値のペアで時系列をビン化します(このようなビンは個あります2N−12N−12^{N-1})。それらの各(フリップフロッすなわちからインデックス1:2の2:1独立確率で)1/21/21/2。 得られた時系列を連続した444観測値でビン化します(個の2N−22N−22^{N-2}ビンがあります)。(それらの各々逆、すなわちからインデックスを1:2:3:4する4:3:2:1確率でindependelty)1/21/21/2。 サイズのビンと同じ手順を繰り返し888、161616、...、2N−12N−12^{N-1}常に確率でビンを逆転させる1/21/21/2。 このデザインは純粋に経験に基づいたものであり、この種の順列で既に公開されているであろう作品を探しています。また、他の順列やリサンプリングスキームの提案も受け付けています。

2
ロジスティック回帰に関する質問
バイナリロジスティック回帰を実行して、10年間(1997年から2006年)にわたって独立変数のセットからの競合(従属変数)の有無をモデル化し、毎年107回の観測を行います。私の独立者は: 土地の劣化(2種類の劣化のカテゴリ); 人口増加(0- no; 1-yes); 生計タイプ(0-タイプ1、1-タイプ2); 人口密度(3レベルの密度); NDVI連続(最大野菜生産性); NDVI t − 1(前年の野菜の減少-0-いいえ、1-はい)およびt − 1t−1_{t-1} およびNDVI t − 2(過去2年からの野菜の減少-0-いいえ、1-はい)。トン- 2t−2_{t-2} 私は全く新しいです-これは私の講師が私に与えたプロジェクトです-だから私はいくつかのアドバイスやガイダンスに感謝するでしょう。私はすでにマルチコリニリティについてテストしました。 基本的に、私のデータは10年間(合計1070)をカバーする107の観測単位(空間領域)に分割され、観測単位ごとに、その単位内のその時点の独立変数の条件の「スナップショット」値になります(領域)。ロジスティック回帰(またはテーブル)を設定して、各年の107個の値を個別に認識して、異なる単位年間の一時的なNDVIの変化を評価できるようにする方法を知りたいですか?

3
誰かが時系列の類似性を決定するための動的なタイムワーピングについて説明してもらえますか?
私は、時系列を一緒に比較するための動的なタイムワープ測定を把握しようとしています。このような3つの時系列データセットがあります。 T1 <- structure(c(0.000213652387565, 0.000535045478866, 0, 0, 0.000219346347883, 0.000359669104424, 0.000269469145783, 0.00016051364366, 0.000181950509461, 0.000385579332948, 0.00078170803205, 0.000747244535774, 0, 0.000622858922454, 0.000689084895259, 0.000487983408564, 0.000224744353298, 0.000416449765747, 0.000308388157895, 0.000198906016907, 0.000179549331179, 9.06289650172e-05, 0.000253506844685, 0.000582896161212, 0.000386473429952, 0.000179839942451, 0, 0.000275608635737, 0.000622665006227, 0.00036075036075, 0.00029057097196, 0.000353232073472, 0.000394710874285, 0.000207555002076, 0.000402738622634, 0, 0.000309693403531, 0.000506521463847, 0.000226988991034, 0.000414164423276, 9.6590360282e-05, 0.000476689865573, 0.000377572210685, 0.000378967314069, 9.25240562546e-05, 0.000172309813044, 0.000447627573859, …

2
ARMA / ARIMAは混合エフェクトモデリングとどのように関連していますか?
パネルデータ分析では、ランダム/混合効果を備えたマルチレベルモデルを使用して、自己相関問題(つまり、観測が時間の経過とともに個人内でクラスター化される)を追加し、他のパラメーターを追加して、時間とショックの特定の仕様を調整しました。ARMA / ARIMAは、同様の問題に対処するように設計されているようです。 私がオンラインで見つけたリソースでは、時系列(ARMA / ARIMA)または混合効果モデルのいずれかについて説明していますが、回帰に基づいて構築することを超えて、2つの関係を理解し​​ていません。マルチレベルモデル内からARMA / ARIMAを使用したい場合がありますか?2つが同等または冗長であるという意味はありますか? これについて議論するリソースへの回答またはポインタは素晴らしいでしょう。

2
Box-Jenkinsモデルの選択
時系列分析におけるBox-Jenkinsモデル選択手順は、系列の自己相関関数と部分自己相関関数を調べることから始まります。これらのプロットは、ARMAモデルで適切なと提案できます。この手順は、AIC / BIC基準を適用して、ホワイトノイズエラー項を含むモデルを生成するモデルの中から最もmost約性の高いモデルを選択するようにユーザーに求めることによって続行します。pppqqq(p 、q)(p、q)(p,q) 視覚検査と基準に基づいたモデル選択のこれらのステップが、最終モデルの推定標準誤差にどのように影響するのかと思っていました。たとえば、横断的ドメインでの多くの検索手順は、標準エラーを下向きにバイアスする可能性があることを知っています。 最初のステップでは、データ(ACF / PACF)を見て適切な数のラグを選択すると、時系列モデルの標準誤差にどのように影響しますか? AIC / BICスコアに基づいてモデルを選択すると、断面法の場合と同様の影響があると思います。私も実際にはこの分野についてあまり知りませんので、この点についてもコメントをいただければ幸いです。 最後に、各ステップで使用される正確な基準を書き留めた場合、プロセス全体をブートストラップして標準エラーを推定し、これらの懸念を排除できますか?

2
定常性の直感的な説明
私はしばらくの間、頭の中で静止状態と格闘していました...これについてあなたはどう思いますか?ご意見やご感想をいただければ幸いです。 定常プロセスは、分布の平均と分散が一定に保たれるように時系列値を生成するプロセスです。厳密に言えば、これは弱い形式の定常性または共分散/平均定常性として知られています。 定常性の弱い形式は、時系列が時間全体にわたって一定の平均と分散を持っている場合です。 簡単に言えば、実務者は定常時系列はトレンドのない時系列であると言います-一定の平均を中心に変動し、一定の分散を持ちます。 異なるラグ間の共分散は一定であり、時系列の絶対位置に依存しません。たとえば、tとt-1(一次遅れ)の間の共分散は常に同じである必要があります(1960年から1970年までの期間、1965年から1975年までの期間、またはその他の期間)。 非定常プロセスでは、系列が元に戻る長期的な意味はありません。したがって、非定常時系列は復帰を意味しないと言います。その場合、分散は時系列の絶対位置に依存し、時間の経過とともに分散は無限になります。技術的に言えば、自己相関は時間とともに減衰しませんが、小さなサンプルではそれらは消えますが、ゆっくりではあります。 定常プロセスでは、衝撃は一時的なものであり、時間とともに消散します(エネルギーを失います)。しばらくすると、それらは新しい時系列値に寄与しません。たとえば、第二次世界大戦のようにログ時間前に発生した(十分に長い)何かが影響を及ぼしましたが、今日の時系列は第二次世界大戦が発生しなかった場合と同じであり、ショックはエネルギーを失ったと言えますまたは散逸した。多くの古典的な計量経済学の理論は定常性の仮定の下で導出されるため、定常性は特に重要です。 定常性の強い形式は、時系列の分布がまったく同じ谷時間である場合です。言い換えれば、元の時系列の分布は、時系列のラグ(任意の数のラグによる)または時系列のサブセグメントとまったく同じです。たとえば、強い形式は、サブセグメント1950〜1960、1960〜1970、または1950〜1960と1950〜1980などの重複期間でも、分布が同じであることを示唆しています。この形式の定常性は、分布を仮定しないため、強いと呼ばれます。それは、確率分布が同じであるべきだと言うだけです。弱い定常性の場合、その平均と分散によって分布を定義しました。暗黙的に正規分布を仮定したため、この単純化を行うことができました。正規分布は、その平均と分散または標準偏差によって完全に定義されます。これは、(時系列内の)シーケンスの確率測度は、同じ時系列内の値の時間差/シフトシーケンスの確率測度と同じであると言うことに他なりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.