タグ付けされた質問 「time-series」

時系列は、(連続時間または離散時間のいずれかで)時間をかけて観測されたデータです。

1
t学生のエラーがあるARMAプロセスの無条件分布
でモデルの誤差が正規分布を持つ場合、無条件の分布ノーマルです。エラーに自由度のt学生分布がある場合。の無条件分布とは何ですか?Yt∼ARMA(p,q)Yt∼ARMA(p,q)Y_t\sim ARMA(p,q)YtYtY_tνν\nuYtYtY_t したがって、 whereです。Yt=ϕ1Yt−1+⋯+ϕpYt−p+et−θ1et−1−⋯−θqet−qYt=ϕ1Yt−1+⋯+ϕpYt−p+et−θ1et−1−⋯−θqet−qY_t=\phi_1Y_{t-1}+\dots+\phi_pY_{t-p}+e_t-\theta_1e_{t-1}-\dots-\theta_q e_{t-q}et∼tνet∼tνe_t\sim t_\nu 私はそれの分布を見つける方法や、主にガウシアンエラーのケースのみをカバーしている本を見つける方法を知りません。 いくつかの参照も興味深いでしょう。

2
線形回帰における遅れた従属変数
最近、時系列データが方程式に従ってモデル化された論文を読みました OLSは、係数を取得するために(R のコマンドと共に)ここで使用されました。統計的に正しいですか?Yt=β1Yt−1+β2X+ε.Yt=β1Yt−1+β2X+ε. Y_t=\beta_1 Y_{t−1}+\beta_2X+\varepsilon. lm()Yt−1Yt−1Y_{t-1} 時系列データを扱う場合、これは実際にはARXプロセスを意味し、として表すことができます ここで、はYule-Walker方程式から得られます。Yt=θYt−1+βX+ε,Yt=θYt−1+βX+ε, Y_t=\theta Y_{t-1}+\beta X + \varepsilon, θθ\theta ウィルと同じ結果が得?、OLS推定器は自己相関問題の受けませんか?私の統計知識は初心者レベルです。これを理解してください。θθ\thetaβ1β1\beta_1E[xtεt]≠0E[xtεt]≠0E[x_t \varepsilon_t] \ne 0

1
2つの時系列が互いに「異なる」かどうかをどのように示すことができますか?
病気の登録簿に載っている若い患者の数が時間とともに増加していることを示す小さなデータセットがあります。これは、レジストリが時間の経過とともに成功し、今ではより多くのケースを捕らえているからだと思います。 したがって、毎年レジストリに登録されている患者の総数(つまり、すべての年齢)とともに、レジストリに登録されている若い患者の数を毎年(たとえば、折れ線グラフなど)プロットし、 私はこれを大まかにExcelで行いましたが、傾向は同じではありません。したがって、傾向が統計的/グラフ的に相互に一致しているかどうかを示したいと思います。誰もが、スタタまたはエクセルのいずれかを使用してこれを行う良い方法を提案できますか?

3
Rでの季節的ARIMAモデリング
私は、あなたが次のリンクでそれを見つけることができる2007年から2017年に商品のために毎月の価格データを持っている: https://drive.google.com/open?id=0BxRCOgKAL4itcUZlOExrUmVOanc 私は次のためにRの季節ARIMAモデルを使用して、それを予測する必要があります年。auto.arima関数を使用している場合は、ARIMA(0,1,1)ではなく、として最適なモデルが提案されますARIMA(p,d,q)(P,D,Q)12。の季節的な部分model(P,D,Q)がどういうわけか欠落しています。なぜこれが起こっているのか分かりません。私のデータは季節的ではありませんか、それとも私のコードに問題がありますか?また、モデルによって与えられる予測値は重要ではない次の月の間一定です。助けてください!これがコードです: data <- read.delim("C:/Users/hp/Desktop/heckyl/forecasting model/Soybean_Prices.txt", header=F) View(data) summary(data) summary(data) ts.data = ts(data, frequency=12, start=c(2007,6)) ts.data plot(ts.data) dim(as.matrix(ts.data)) ################################################################################ # Training and Testing Dataset data.train = window(ts.data, start = c(2007,6), end = c(2013,12)) plot(data.train) dim(as.matrix(data.train)) data.test = window(ts.data, start = c(2014,1)) plot(data.test) dim(as.matrix(data.test)) ################################################################################ # Developing an SARIMA model …

2
障害が発生する前にその兆候を特定するための予測保守モデル
状況 センサーデータを使用して、障害が発生する前にマシンの障害を予測する問題に取り組んでいます。調査する方法についてアドバイスが必要です。 具体的には、実際に障害が発生する前に、差し迫った障害の兆候を特定したいと考えています。理想的には、これにより、障害が発生する前に何が起こっても修正できる十分なリードタイムが得られます。 問題 私がいる概念的なロードブロックは、さまざまな分類モデル(ロジスティック回帰、決定木、最近傍など)をデータに適合させて、その時点で特定のパラメーターが与えられた場合の失敗の確率を特定できることを知っています。ただし、実際に何かを行うのに十分な時間をかけて、次の障害の兆候を特定する方法を理解することはできません。 可能なアプローチ 私はサバイバル分析に精通していますが、複数のマシンからのデータがないため、修理後にマシンが100%に戻ったとは言えないので、必ずしも適切であるとは思いません。 また、障害が発生した時間を取り、それを1時間戻し、その点をどれだけ正確に予測できるかを考えました。可能な場合は、ターゲットをさらに1時間戻し、自信を持って予測できるリードタイムを確認します。しかし、これが適切かどうかはわかりません。 利用可能なデータ 私が持っているデータは、1台のマシンから1年間にわたって記録されています。2分ごとに記録される約60個のセンサーがあります。これらのセンサーは、マシンを構成するさまざまなコンポーネントの温度(サーモスタットの設定と実際の温度を含む)、マシンの動作速度、マシン全体の蒸気圧、ファン速度、マシンが動作しているかどうかなどの変数を測定します、など センサーの読み取り値に加えて、マシンが実行されていない理由(シフトの変更、予防保守、故障など)も含まれるようにデータセットを充実させました。この記事の最後に、データがどのように表示されるかについての例をまとめました。データセット全体でキャプチャされた多様性の一部をキャプチャするように例を変更しました。実際には、マシンが実行を停止すると、理由にもよりますが、2分から2日の間停止します。また、変数は以下の例のように必ずしもそれほど急速に変化するわけではありませんが、いくつかの種類を提供したいと思いました。 +-----------------+----------+-------------+------------+------------+-------+-------+-----+--------------------------+------------+ | Datetime | CircFan | CircFanAct | EntrySpeed | ExhaustFan | Speed | Temp1 | Run | Reason | TimeBtwRun | +-----------------+----------+-------------+------------+------------+-------+-------+-----+--------------------------+------------+ | 2009-10-19 0:00 | 100 | 600 | 461 | 40 | 45 | 1126 | …

2
定常時系列とは何ですか?いくつかの例は何ですか?
私の計量経済学のクラスでは、教師は次のように定常時系列を定義しました。私はいくつかの例がどうなるかについて混乱しています。トレンドがないと仮定すると、年間を通じて気温は一定でしょうか?定常性とは、データ内の唯一の動きがランダムなホワイトノイズに起因することを意味しますか?いくつかの例は何ですか?例に困惑しています。

2
加法モデルと乗法モデルのどちらを選択しますか?
現在分析しているデータのセットがあります。 データを予測するために加法モデルを使用する必要があるかどうか、または乗法モデルを使用する必要があるかどうかを判断するのが困難です。 2つの違いを知っているので、生データが線形のときに正しいモデルを適用できますが、この場合、データは非線形です。 データの時系列を添付しました。2つのモデルのどちらを使用する必要がありますか。その理由は何ですか。 (私の本能は、季節変動の大きさ(またはトレンドサイクルの変動)が時系列のレベルによって変化しないように見えることに基づいて、加法モデルを使用することです。

1
フィードフォワードネットワーク上でリカレントニューラルネットワークを使用するための数学的な正当化
シーケンシャルデータを処理するときに、フィードフォワードネットワークよりもRNNが優れていることの背後に数学的な理由があるかどうか疑問に思い、理解しようとしました。たとえば、時系列、HMMなどをモデル化する場合。シーケンスの長さは固定されているが、非常に大きいと仮定します。 直感的には、RNNが状態変数の現在の時刻までの関連情報を記憶し、それを使用して現在の入力基づいて状態をに更新できることは明らかです。たとえば、フィードフォワードネットワークを使用してをモデルする場合、ごとに入力ノードを用意し、それらを合計してを取得する必要がありが、RNNではは単一の入力ノードが必要であり、状態は合計ます。tttht−1ht−1h_{t-1}hthth_txtxtx_tYt=Xt+Xt−1+…+X0Yt=Xt+Xt−1+…+X0Y_t=X_t+X_{t-1}+\ldots+X_0XiXiX_iYtYtY_tXtXtX_tXt−1+…+X0Xt−1+…+X0X_{t-1}+\ldots+X_0 上記の例はかなり基本的なものですが、RNNの複雑さ(ノード数、深さ)は、フィードフォワードの場合に比べてはるかに少ないことを示しています。 フィードフォワードでは取得できないが、RNNで十分に近似できる関数のファミリの例を誰かが提供できますか?これに言及する参考文献もまた高く評価されます。

1
時系列分析におけるBoxCox変換のラムダ値
私は予測のオンラインバージョンを読んでいました。RobJ HyndmanとGeorge Athanasopoulosによる原則と実践です。STL分解とBoxCox変換に関する次の文を見つけました。 「0 <λ<1のデータのBox-Cox変換を使用すると、加法分解と乗法分解のいくつかの方法が得られます。λ= 0の値は乗法分解に対応し、λ= 1は加法分解に相当します。」 私の質問は、なぜその範囲のラムダだけが有効なオプションになるのですか?ラムダが-0.5または2に等しくないのはなぜですか?

1
混合モデルの経時変化に対するベースラインの影響?
いくつかのサンプル内で、混合モデルを使用して、この結果のベースライン値に依存する時間の経過に伴う結果の変化をモデル化することが可能かどうか、またどのように可能かと思っていましたか? たとえば、同じ知識グループが同じグループの人々に5回実行される状況を想像してみてください。質問は常に同じであるため、学生は時間の経過とともに正しい答えを学び、各行政機関でより高いスコアを獲得します。ただし、そもそもスコアが高い人は、スコアが低い人よりも変化が少ないでしょう。したがって、変化率がベースライン値に依存していることは明らかです。 混合モデルでは、一部の学生では他の学生よりも変化が大きいという事実を説明するために、ランダムな切片に加えて時間のランダムな勾配を含めることができることを知っています。しかし、最初の測定値をベースライン共変量(およびその時間との相互作用)として含めることは不可能または意味がないと私は思いますか?いずれにせよ、私には「感じ」られない。しかし、その一方で、固定効果を使用してベースライン値の効果を明示的にモデル化することは不可能だと私の心を揺さぶります。私はこれについて多少混乱していることを認めなければなりません。任意の助けをいただければ幸いです。

1
時系列のスペクトル分解はモデリング/予測に役立ちますか、それとも分析用のツールですか?
これは少し理論的な質問です。私は時系列分析も初めてで、早く学習しようとしています。私の用語の一部がオフになっている場合は申し訳ありません。 時系列を時間領域と周波数領域のアプローチに分析およびモデル化する方法を大まかに分類できます。時間領域では、ARIMAのようなモデルは最近の測定に基づいて予測します。将来のある時間Xの予測は、それに近づくにつれて良くなります(1ステップの予測が最良です)。 最近の測定値を線形結合する代わりに、信号を正弦波と余弦波の和に分解できます。これは、信号に周期的/季節的成分が強い場合に特に適しています。しかし、これの予測は一定の期間の無限に繰り返されるシグナルではないでしょうか?そのため、単に分解をやり直さない限り、新しい情報が入力されても将来の値Xの予測は変化しません。 正確な質問をいくつか説明させてください。 1)スペクトル分解はモデリング/予測に役立ちますか、それとも通常分析目的でのみ使用されますか? 2)スペクトル分解の予測は常にいくつかの繰り返される定期的なシリーズですか? 3)季節的ARIMAを使用すると、スペクトルモデルの残差のARIMAモデルを使用した場合でも、(予測の観点から)スペクトル分解よりもパフォーマンスが向上する可能性がありますか?(季節的/周期的な傾向が強いデータを想定) 4)時系列のスペクトル分解をオンラインまたは反復的に更新する方法はありますか? これらすべてに詳細に答える必要はありません。彼らがあなたが私が探しているものについてのアイデアを与えると思います。関連性があると思われる方法またはモデルを知っている場合、名前は私が調査するのに十分な見込みです。同様に、周波数分解がモデリングと予測の点で行き止まりである場合、それは知っておくべきです。 助けてくれてありがとう!

2
すべてのARIMA(1,1,0)モデルはAR(2)モデルと同等ですか?
次の形式のARIMA(1,1,0)モデルを使用して近似したい時系列あるとします。xtxt x_t Δxt=αΔxt−1+wtΔxt=αΔxt−1+wt \Delta x_t = \alpha \Delta x_{t-1} + w_t これは次のように書き直すことができます。 xt−xt−1=α(xt−1−xt−2)+wtxt−xt−1=α(xt−1−xt−2)+wt x_t - x_{t-1} = \alpha ( x_{t-1} - x_{t-2} )+ w_t xt=(1+α)xt−1−αxt−2+wtxt=(1+α)xt−1−αxt−2+wt x_t = ( 1 + \alpha)x_{t-1} - \alpha x_{t-2} + w_t 最後の方程式は、係数がおよび AR(2)モデルを表しています。によっては、このAR(2)モデルが非定常である可能性があることを認識しています。ただし、最初に差分を取っていた場合、モデリングしているシリーズは静止していてはいけません。1+α1+α1+\alpha−α−α-\alphaαα\alpha モデルが定常的でない場合は、差分を使用する必要があることを知っています。しかし、AR(2)モデルとARIMA(1,1,0)モデルを使用した場合、結果はどのように異なりますか?私は(Rが示唆するように)収束に問題があると思います。ただし、Rに近似を実行するように依頼すると、Rは両方を実行し、係数は(ほとんど)上記の私の観察と一致します。ただし、予測は明らかに異なります。 誰かがこれに光を当てたり、私に良い参照を指摘したりできれば、私はそれを感謝します。 これは、両方のモデルを生成するために使用したRコードです。 > set.seed(2) > x <- arima.sim(n = 1000, model=list(order=c(1,1,0), …
7 r  time-series  arima 

1
TVアトリビューションにARMAXモデルを使用することは有効ですか?
毎時のトラフィックのベースラインがあるウェブサイトがあるとします。また、テレビ広告を断続的に実行しているため、Webトラフィックが増加しています。私のテレビ広告がウェブトラフィックの増加に関してどの程度の影響を与えているのかを調べたいと思います。 毎時のテレビ広告費またはインプレッションを外生変数としてARMAXモデルに当てはめる場合、AR用語は「ベースライントラフィック」を表し、回帰用語はTV広告に起因するトラフィックを表すと主張することは有効ですか? これが私がやろうとしていることのいくつかのサンプルコードです: library(forecast) xmat <- as.matrix(cbind(data[,c("AdSpend","Impressions")])) xvar <- data$WebSessions fit <- Arima(x=xvar, xreg=xmat, order=c(12,0,0), include.constant=FALSE) reg_terms <- fit$coef["AdSpend"] * data$AdSpend + fit$coef["Impressions"] * data$Impressions AR_terms <- fitted(fit) - reg_terms 次に、AR_terms(ベースラインの1時間ごとのWebトラフィック)とreg_terms(TVに起因する1時間ごとのトラフィック)を使用して、積み上げ面グラフを作成できます。 これは有効なアプローチですか? 助けてくれてありがとう。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.