TVアトリビューションにARMAXモデルを使用することは有効ですか?


7

毎時のトラフィックのベースラインがあるウェブサイトがあるとします。また、テレビ広告を断続的に実行しているため、Webトラフィックが増加しています。私のテレビ広告がウェブトラフィックの増加に関してどの程度の影響を与えているのかを調べたいと思います。

毎時のテレビ広告費またはインプレッションを外生変数としてARMAXモデルに当てはめる場合、AR用語は「ベースライントラフィック」を表し、回帰用語はTV広告に起因するトラフィックを表すと主張することは有効ですか?

これが私がやろうとしていることのいくつかのサンプルコードです:

library(forecast)

xmat <- as.matrix(cbind(data[,c("AdSpend","Impressions")]))
xvar <- data$WebSessions

fit <- Arima(x=xvar, xreg=xmat, order=c(12,0,0), include.constant=FALSE)

reg_terms <- fit$coef["AdSpend"] * data$AdSpend + fit$coef["Impressions"] * data$Impressions
AR_terms <- fitted(fit) - reg_terms

次に、AR_terms(ベースラインの1時間ごとのWebトラフィック)とreg_terms(TVに起因する1時間ごとのトラフィック)を使用して、積み上げ面グラフを作成できます。

ここに画像の説明を入力してください

これは有効なアプローチですか?

助けてくれてありがとう。

回答:


2

これは素晴らしい質問です。一杯のコーヒーを手に入れ、Rob Hyndmanの「ARIMAXモデルマドル」に関するブログ記事を注意深く読むことをお勧めします。

基本的に、答えはノーです。単純なAR(I)MAXモデルを当てはめる場合、共変量係数はプロモーション効果として解釈できません。問題は、共変量値の変更が、以前の適合に依存する予測に影響を与えることです。これは解釈し、伝達することは非常に困難です。

ただし、Rへの呼び出しは実際にはAR(I)MAXモデルに適合Arima()ないため、すべてが失われるわけではありませ。むしろ、最初に共変量の観測値を回帰し、次にAR(I)MAプロセスで残差をモデル化します。つまり、AR(I)MAエラーを伴ういわゆる回帰に適合します。そして、このモデルでは、あなたの解釈-共変量とその係数がプロモーション効果をキャプチャしているのに対し、ARMAパーツは "残り"をキャプチャしています-は完全に有効です。

現在、AR(I)MAXモデルまたはAR(I)MAエラーのある回帰のどちらがより良い予測を生成するかはわかりません。AR(I)MAXモデルをRに実際に適合させる簡単な方法と、上記の解釈上の問題がわからないので、真のAR(I)MAXモデルを過度に心配せずに、Arima()あなたに与えるもので。

しかし、ネットサーフィンやテレビ視聴は、 -日中のパターンは、週末とそれ以外の曜日では大きく異なる場合があります。これはプロットには表示されませんが、データがこれを示しているかどうかを確認することをお勧めします。もしそうなら、複数の季節性を伴う予測にいくつかの作業があり、主に指数平滑法や状態空間モデルのバリアントを使用しています。これらのいくつかは、複数の季節性と説明変数を同時にモデル化できる場合があります。


すばらしい回答、ありがとうございます!より複雑なモデルを構築する予定ですが、一般的なアプローチが正しいかどうかを確認したいだけです。
Peter
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.