Rの因果関係の影響パッケージを使用して、相関性が高く季節性のあるいくつかのデータにおける介入の因果関係の影響を推測しています。
具体的には、17日の毎時データを取得しました。介入は1日の終わりに発生します。介入にはまったく影響を受けない2つの制御データセット(0.708と0.701の線形相関)と、介入を含むデータセット(別名「扱われる」)
データの一部は ここにあります
私のコードは次のとおりです
days <- 4
daily.obser <- days*24
data.1 <- cbind(treated.signal.3n,the.control.3,the.control.2)
data.1 <- data.1[1:((length(bsl)+1)+daily.obser), ] #check the required amount of data only
matplot(data.1, type = "l",col = c(2,4,9))
legend("bottomright", inset=.05, legend=c("Treated Zone", "Control Zone 1", "Control Zone 2"), pch=1, col=c(2,4,9), horiz=TRUE)
preperiod <- c(1,length(bsl))
postperiod <- c((length(bsl)+1),(length(bsl)+1+daily.obs))
prior.level.sd.level <- 0.01
imp.1 <- CausalImpact(data.1, pre.period = preperiod, post.period = postperiod,
model.args = list(niter = 2500,nseasons=17, season.duration = 24,
dynamic.regression = FALSE, prior.level.sd =prior.level.sd.level,standardize.data = TRUE))
summary(imp.1)
plot(imp.1,c("original","pointwise"))
summary(imp.1,"report")
私の質問は:
私はこの論文を読みましたが、ある時点で、それは分散の事前分布について話しています。prior.level.sd
データに基づいて、パラメーターを何に設定すればよいかわかりません。
私が直面している別の問題はnseasons,season.duration
議論です。これを指定すると、結果では、介入は取るに足らない(そしてCIは巨大になっている)ことがわかりますが、そうしないと、介入が重要になります。されるnseasons
データセット全体のためか、単に介入前の期間(例えば17または13)のための日数を言うことになって?季節性を正確に指定するとはどういう意味ですか?データに基づいて、これをスキップできますか?
(私の場合は役に立たないため、累積を提供していません)
(介入前の期間にはフィットがそれほど良くないことに気づくでしょう。どういうわけかこれを修正できますか?)
データを標準化するかどうかを指定する方法はわかりません。
最後に、静的または動的回帰について考えています。論文では、コントロールと治療の関係が安定している場合はスタティックを使用することをお勧めします。誰かが馬小屋の意味を説明できますか?
あなたはここに紙を見つけるかもしれません