タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

2
セキュリティリターン+ ARIMA / GARCHの質問を予測するために使用できる計量経済モデル
私は学部の論文を書こうとしています。そこでは、特定の金融時系列で特定の計量経済モデルの予測力をテストします。私はこれをどうやってやるべきかについていくつかのアドバイスが必要です。状況を説明するために、私は主に計量経済学を自己学習しています。私がこのテーマに取り組んだ唯一のコースは、時系列モデルを掘り下げる前に止まったので、私はこのテーマの専門家ではありません。 残念なことに、私は最近ARIMAモデルが株価(およびその他のセキュリティ)のリターンを予測するのが非常に悪いことを読みました。私の学校の経済学部の教授もこれを確認しました。この間ずっと、それらがおそらくいくつかの財務時系列の予測にリモートで役立つことを願っていました...私が見ることができる他のモデルはありますか?私の目標は、RまたはMATLABで時系列の計量経済モデリングを学習し、うまくいけば統計的に有意な予測結果を見つけることです。また、あなたが注目する特定の市場(エネルギー、レート、株式)はあ​​りますか? 最後に、GARCHはボラティリティの予測にのみ使用されますか?私が言及した教授は、株価のリターンをモデル化するために、GARCHまたはARIMA-GARCHモデルに目を向けるべきだと示唆しているようです。実際の返品にも使えるかもしれないと思われる論文をいくつか読んだのですが... ARIMA-GARCHモデルのARおよびMAコンポーネントは、ARMAモデルのコンポーネントと異なりますか?私が漠然と理解したことから、ARIMAとGARCHは2つの完全に別のものです(前者は実際の時系列を予測するために使用され、もう一方はその変動性を予測するために使用されます)。 質問が多すぎないことを願っていますが、どこに向かえばよいのかわからないので、私はこれまでずっと自分で研究してきました。どうもありがとう!

1
ランダムウォークは正確に何をしますか?
正直なところ、私はこの質問に関する多くのWebサイトと回答を読みましたが、理解しやすい簡単な言葉では説明していません。私がしたいのは、ランダムウォークの機能と、それを遺伝子セット濃縮分析にどのように使用できるかを理解することです。 ここに公開された論文があります。 誰かがそれを簡単な言葉で説明できますか?

1
時系列予測の問題
Rでの時系列のモデリングについて質問を受けました。私のデータは次のマトリックスで構成されています。 1 0.03333333 0.01111111 0.9555556 2 0.03810624 0.02309469 0.9387991 3 0.00000000 0.03846154 0.9615385 4 0.03776683 0.03119869 0.9310345 5 0.06606607 0.01201201 0.9219219 6 0.03900325 0.02058505 0.9404117 7 0.03125000 0.01562500 0.9531250 8 0.00000000 0.00000000 1.0000000 9 0.04927885 0.01802885 0.9326923 10 0.06106870 0.02290076 0.9160305 11 0.03846154 0.00000000 0.9615385 12 0.00000000 0.00000000 1.0000000 13 …

4
回帰係数に季節性を許容する方法はありますか?
時系列G tと共変量B tがあるとします。ARMAモデルによってそれらの間の関係を見つけたい: G T = Z T +β 0 +β 1 B T ここで、残差Z tはいくつかのARMAプロセスに従います。 問題がある:私は確かに知っているβ 0及びβ 1年の時間とともに変化します。それでも、月ごとに個別のモデルをあてはめたくありません。これは、時系列に不連続性をもたらすため、最終的な残差の自己相関関数を計算できないためです。 それで、共変量の相関係数を季節的に変化させることができる時系列モデル(またはモデルのファミリー、不思議)はありますか? ======================== 編集:ここに答えてくれてありがとう。季節限定のダミーを使うことにしたのですが、忙しかったので間に合いませんでした。

3
分布を見つけて正規分布に変換する
1時間にイベントが発生する頻度(「1時間あたりの数」、nph)とイベントが持続する時間(「1秒あたりの秒数」、dph)を説明するデータがあります。 これは元のデータです: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, NA, 6.00000000004109, 9.71428571436649, 12.4848484848485, 16.5034965037115, 20.6666666666667, 3.49999999997453, 4.65882352938624, 4.74999999996544, 3.99999999994522, 2.8, 14.2285714286188, 11.0000000000915, NA, 2.66666666666667, 3.76470588230138, 4.70588235287673, 13.2727272728677, 2.0000000000137, 18.4444444444444, 17.5555555555556, 14.2222222222222, 2.00000000001663, 4, 8.46153846146269, 19.2000000001788, 13.9024390245481, 13, 3.00000000004366, NA, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

1
VARモデルをRで近似する[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 2年前休業。 私は2変量の時系列を持っています。z_tここz_1tで、米国の毎月の短期国債(満期3か月)の変化z_2tと、米国の月次消費者物価指数(CPI)のパーセントでのインフレ率です。使用されるCPIは、都市部のすべての消費者の消費者物価指数:すべてのアイテム(CPIAUCSL)です。元のデータは、セントルイス連邦準備銀行からダウンロードされます。CPIレートは、ログCPIインデックスの最初の差の100倍です。指定したVARモデルを近似し、しきい値R 1.65のコマンドR(refVarパッケージからMTSまたはrestrictパッケージからvars)によって近似を簡略化したいと思います。 この演習(pdf)は、シカゴ大学のR. TsayのWebサイトで見つけました。データはこちら。 私が今まで行ったことは次のとおりです。 y <- diff(zt[,3]) lot(y, type="l", ylab="tb3m") # difference x <- diff(log(zt[,4])) plot(x, type="l", ylab="CPI rate") new <- cbind(x, y) # order selection gives VAR(6) VARselect(new, lag.max=9, type="const") data1 <- data[,c("tb3m","cpiaucsl")] fit <- VAR(data1,p=6) fit restrict(fit, method="ser", thresh=1.65, resmat=T) restrictそしてVAR私の右の結果またはPDFで回答におけるVaRモデルの同じ係数を与えることはありません。
8 r  time-series  var 

4
短い時系列データのアップ/ダウンパターンの分析
私は時系列データをあまり頻繁に扱っていないので、この特定の質問をどのように進めるのが最善かについて、いくつかの指針を探しています。 次のデータがあるとしましょう-以下のグラフ: ここでは、x軸に年があります。Y軸は「不平等」の尺度です。たとえば、国の所得の不平等かもしれません。 この質問について、私は年ごとにデータにアップ/ダウンの性質があるかどうかを尋ねることに興味があります(より良い説明が必要なため)。本質的には、昨年、不平等が前年度から上昇したのか、今は低下する可能性があるのか​​?浮き沈みの大きさも重要な要素です。 私はそのようなことを考えていますwavelet analysisかFourier analysis私は前にこれらを使用していないものの、5月の助けを、私はこのようなサンプルサイズが小さすぎると考えています。 フォローアップするためのアイデア/提案に興味があります。 編集: これらはこのチャートのデータです: # year value #1 1956 0.9570912 #2 1957 1.0303563 #3 1958 0.9568302 #4 1959 1.1449074 #5 1960 0.8962963 #6 1961 1.0431552 #7 1962 0.8050077 #8 1963 0.8533181 #9 1964 0.9971713 #10 1965 1.0453083 #11 1966 0.8221328 #12 1967 1.0594876 #13 …

1
時系列回帰の非表示モデルとステートレスモデル
これは非常に一般的な質問です。前の観測に基づいて次の観測を予測するモデルを構築したいとします(は実験的に最適化するためのパラメーターにすることができます)。したがって、基本的に、次の観測を予測するための入力フィーチャのスライディングウィンドウがあります。NNNNNN 隠れマルコフモデルのアプローチ、つまりBaum-Welchを使用してモデルを推定し、Viterbiが最後の観測に基づいて現在の状態を予測し、次に現在の状態に基づいて最も可能性の高い次の状態を予測し、次に次の状態を予測します。最も可能性の高い次の状態とHMMパラメーター(または次の観測の予測分布を見つけるなどのバリアント)を使用した観測。NNN または、SVM、線形回帰、スプライン、回帰ツリー、最近傍などのステートレスモデル(入力として以前の観測を取得できる)を使用して、はるかに単純なアプローチを使用することもできます。このようなモデルは、いくつかの予測誤差の最小化に基づいていますしたがって、概念的には、隠れた状態ベースのモデルよりもはるかに単純です。NNN 誰かがそのようなモデリングの選択に対処した彼女/彼の経験を共有できますか?HMMを支持して何を話し、回帰アプローチを支持して何を話しますか?直感的には、過剰適合を避けるために可能な限り単純なモデルを採用する必要があります。これは、ステートレスなアプローチを支持して話します...また、両方のアプローチがトレーニングのために同じ入力データを取得することを考慮する必要があります(これは、非表示の状態モデルのモデリングに追加のドメイン知識を組み込まない場合、たとえば特定の状態と遷移確率を修正します。非表示状態モデルのパフォーマンスが向上する理由はありません)。最後に、もちろん両方のアプローチを試して、検証セットで何がより効果的かを確認できますが、実際の経験に基づくいくつかのヒューリスティックも役立つかもしれません... 注:私にとっては、特定のイベントのみを予測することが重要です。私は、「平均的/頻繁な」イベントを予測するが、興味深いイベントはあまり予測しないモデルよりも、「興味深い/まれな」イベントをほとんど予測しないモデルを好みます。おそらくこれはモデリングの選択に影響を与えます。ありがとう。

2
実世界でのMA(q)モデル入力とは何ですか?
AR(p)モデルを理解しています。その入力はモデル化される時系列です。MA(q)モデルについて読むとき、私は完全に行き詰まっています。その入力は、しばしば定式化されているため、イノベーションまたはランダムショックです。 問題は、(完全な)時系列のモデルがないイノベーションコンポーネントを取得する方法が想像できないことです(つまり、ε = Xo b s e r v e d− XP E R Fe c tε=Xobserved−Xperfect\varepsilon=X_{\rm observed}-X_{\rm perfect}、そしてそれはおそらく間違っています)。さらに、この革新的なコンポーネントをサンプルで取得できる場合、長期予測(個別の追加時系列コンポーネントとしてのモデル誤差項)を実行するときにどのように取得できますか?

1
時系列は明らかに周期的ですが、季節分解はRでは機能しません[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 2年前休業。 私の時系列は明らかに周期的ですが、stl()を使用した季節分解はRでは機能しません。 a <- c(6.7, 20.3, 23.5, 7.9, 3.3, 2.0, 2.5, 2.9, 2.3, 5.0, 15.0, 20.1, 27.0, 28.2, 18.3, 7.8, 1.6, 0.8, 1.3, 1.2, 0.6, 1.6, 4.9, 24.2, 28.8, 23.6, 18.6, 5.3, 1.8, 0.4, 0.5, 0.2, 0.1, 0.3, 3.5, 17.6, 26.1, 22.7, 18.2, 7.2, 2.1, 1.0, 1.1, …

1
移動標準偏差の計算から生じる時系列の自己相関関数とは何ですか?
たとえば、観測の時系列があり、その時系列の分散の測定値を、幅ローリングウィンドウの標準偏差(SD)として計算し、そのウィンドウが系列上で単一の時間ステップで移動するとします。さらに仮定するW = ⌈ N / 2 ⌉、ここでnは観測の数であり、ウィンドウが右に整列されます。私が観察する必要がありwは= ⌈ N / 2 ⌉私は、時系列のSDの移動ウィンドウ推定値を得始める前に、系列の値。wwwW = ⌈ N / 2 ⌉w=⌈n/2⌉w = \left \lceil{n/2}\right \rceilんnnW = ⌈ N / 2 ⌉w=⌈n/2⌉w = \left \lceil{n/2}\right \rceil SD値の新しい時系列のACFに期待される形式はありますか?以前の値への依存はのウィンドウに関連していると思いますが、そのようなシリーズのACFはM A(w )プロセスのACFに関連していますか?wwwM A(w)MA(w)\mathrm{MA}(w) バックグラウンド 移動するウィンドウを介して、元の時系列の分散の時系列を導出することの影響を検討しようとしています。SD値の派生シリーズを計算したら、通常適用される次のステップは、SD値の派生シリーズに何らかの傾向があるかどうかを確認することです。派生シリーズの各値は、元のシリーズの以前の値にある程度依存するため、派生シリーズの値は独立していません。したがって、頻繁に発生する問題は、独立性の欠如をどのように説明するかです。 そのような計算(移動ウィンドウ)は、切迫したしきい値応答(いわゆるクリティカル遷移)のインジケーター(分散の増加、AR(1)係数の増加)の証拠を探すために時系列で行われることがよくあります。

1
不定期時系列の予測(Rあり)
等距離の時系列を予測する方法はいくつかあります(例:Holt-Winters、ARIMAなど)。しかし、私は現在、次の不規則な間隔のデータセットに取り組んでいます。これには、年間のデータポイントの量が異なり、それらのポイント間に定期的な時間間隔はありません。 プロット: サンプルデータ: structure(list(date = structure(c(664239600, 665449200, 666658800, 670888800, 672184800, 673394400, 674517600, 675727200, 676936800, 678146400, 679356000, 680565600, 682984800, 684194400, 685404000, 686613600, 687823200, 689036400, 690246000, 691455600, 692665200, 695084400, 696294000, 697503600, 698713200, 699922800, 701132400, 703548000, 705967200, 707176800, 708472800, 709682400, 710805600, 712015200, 713224800, 714434400, 715644000, 716853600, 718063200, 719272800, 720486000, 721695600, 722905200, 724114800, 726534000, …

1
最良の相関する時系列の決定
質問する前に、私は同様の質問を読みましたが、どれも私の特定の興味のために満足のいく答えにつながりません。 ドミニカ共和国の降水量の気候時系列を64年間(1940〜2003年)均質化したいと思います。そのためには、候補者のグループから参照シリーズを選択することが非常に重要です。 sjoベースシリーズがあるとしましょう。このシリーズについて、良い参照シリーズを見つけたいと思います。bani、plcおよびにra近いため、参照候補sjoです。次のマップでは、赤い点が基地局で、緑の点が参照候補です。 cor()これらの月次変数を考慮して、3つの相関分析(Rで実行、関数)を実行しました。生の降水量の値、正規化された差、およびBox-Coxで変換された値です。これらの変数で始まるフィールドに、それぞれ、対応p、dianおよびpnorm。 正規化された差分は、Petersonによって提案された最初の差分級数法(FDM)から得られ、 で構成されます。ここで、は降水量の値です月場合、は1年前の同じ月の降水量です。Petersonと同僚(1998)の発言に従いました。これは、降水量に適用されたFDMは、正規化された差を使用するとより効果的に機能する可能性があると述べています。P m t m P m t − 1[ Pメートルt− Pメートルt − 1] / [ Pメートルt+ Pメートルt − 1][Pmt−Pmt−1]/[Pmt+Pmt−1][Pm_t - Pm_{t-1}] / [Pm_t + Pm_{t-1}]PメートルtPmtPm_tメートルmmPメートルt − 1Pmt−1Pm_{t-1} このPDFファイルの 1ページにあるように、相関は時系列全体(1940-2003)に対して計算されました。生の降水量とBox-Cox変換値の場合、baniとの相関が最も良好ですsjo(黄色の背景セルは最大の相関指数を示します)。生の降水量についてbaniは、他の降水量よりも大幅に相関しています。正規化された差のra場合、他よりも少しだけ相関があります。ただし、各候補sjoは有意水準で統計的に有意な相関指数があり、それらのいずれかを参照系列として使用できることを示唆しています。α = .05α=.05\alpha=.05 これは少し混乱するので、満足できず、さらに詳細な分析を行い、系列を5年の期間間隔で分割し、同じ3つの変数の系列間の相関を評価することに決めました:生の降水量、正規化された差、Box-Cox変換。 PDFの2〜8ページの表は、これらの部分相関の結果を示しています。最後のページは、各測点が各変数の最大相関値を持っていた時間を要約しています。見てわかるように、baniは分析された3つの変数の最も頻繁に相関する値です(すべてのケースで、分析された12の5年間の7倍以上)。 これらの結果から、これbaniはの参照シリーズとして最良の候補だと思いますsjoが、私にはわかりません。5年間の分析は正常ですか?他の分析を実行する必要がありますか?

1
ゾンビの確率パズル[終了]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 9か月前に閉鎖。 ゾンビについて簡単なゲームを書くことを考えています。ゾンビになるべき人の数を計算しようとして動けなくなった。 私の状況は次のとおり です。700人の小さな田舎町があります。一晩で200体のゾンビが町にやってきます。各ゾンビには、1人の人間が感染して新しいゾンビになる50%の確率で、1日あたり30%の単一の接触確率があります。1日目、2日目、3日目に何人がゾンビになりますか? 町の人の数に応じて感染の可能性を活用することにしました。人が多ければ多いほど、接触の可能性は低くなります(物議を醸すように見えるかもしれませんが、そうなる可能性があります)。だから、(200/700)*0.3=0.086または8.6%偶然に連絡してください。それから私は、1人のゾンビが8.6%1人の人間に感染する可能性があると思い始めました。1日の間、200人あたり200回の試行しかありません。感染の確率が99.9%で、60のように見える試行回数を見つけようとしました。その後、約60 700/60=11.6人に1人の人間が感染することになります。つまり、1日あたりの人です。私は統計の背景がないので、私はおそらく間違っています、誰かが私を助けてくれるといいですね。

3
RでArimaモデルを近似するときのoptimのエラー
Rの統計パッケージのarimaメソッドを、時系列の17376要素で使用しています。私の目標は、AIC基準の値を取得することです。最初のテストでこれを観察しました。 ts <- arima(serie[,1], order = c(2,1,1), seasonal = list(order=c(2,0,1),period = 24), method = "CSS", optim.method = "BFGS",) > ts$coef ar1 ar2 ma1 sar1 sar2 sma1 0.8883730 -0.0906352 -0.9697230 1.2047580 -0.2154847 -0.7744656 > ts$aic [1] NA ご覧のとおり、AICは定義されていません。AICについて、Rの「ヘルプ」は「ML」でのみ使用できると述べました。しかし、それは起こります: > ts <- arima(serie[,1], order = c(2,1,1), seasonal = list(order=c(2,0,1),period = 24), method …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.