「四半期ごとの3担当者」が正確に何を意味するかによって、パネルデータ(Wikipedia)モデルが意味をなす場合があります。これは、四半期ごとに3つの測定値を取得していることを意味します。データは次のようになります。
obs quarter value
A 1 2.2
A 2 2.3
A 3 2.4
B 1 1.8
B 2 1.7
B 3 1.6
C 1 3.3
C 2 3.4
C 3 3.5
これがあなたが見ているものであれば、パネルデータを操作するためのモデルがいくつかあります。以下は、パネルデータの表示に使用する基本的なRのいくつかをカバーする適切なプレゼンテーションです。このドキュメントは、計量経済学の観点からではありますが、もう少し深く掘り下げています。
ただし、データがパネルデータの方法論に適合しない場合は、「プールされたデータ」に使用できる他のツールがあります。この論文の定義(pdf):
データのプールとは、複数の母集団に関連する複数のデータソースを使用した統計分析を意味します。情報の平均化、比較、一般的な解釈が含まれます。関係するデータソースと母集団が同じか、類似しているか、異なるかによって、異なるシナリオと問題も発生します。
ご覧のとおり、その定義から、使用する手法は、データから何を学習することが期待されているかに依存します。
各四半期の3つのドローが時間的に一貫していると仮定して、開始する場所を提案するとしたら、固定効果推定器(内部推定器とも呼ばれます)を使用して、データ。
上記の例では、コードは次のようになります。
> Panel = data.frame(value=c(2.2,2.3,2.4,1.8,1.7,1.9,3.3,3.4,3.5),
quarter=c(1,2,3,1,2,3,1,2,3),
obs=c("A","A","A","B","B","B","C","C","C"))
> fixed.dum <-lm(value ~ quarter + factor(obs), data=Panel)
> summary(fixed.dum)
これにより、次の出力が得られます。
Call:
lm(formula = value ~ quarter + factor(obs), data = Panel)
Residuals:
1 2 3 4 5 6 7
-1.667e-02 -8.940e-17 1.667e-02 8.333e-02 -1.000e-01 1.667e-02 -1.667e-02
8 9
1.162e-16 1.667e-02
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.13333 0.06055 35.231 3.47e-07 ***
quarter 0.08333 0.02472 3.371 0.019868 *
factor(obs)B -0.50000 0.04944 -10.113 0.000162 ***
factor(obs)C 1.10000 0.04944 22.249 3.41e-06 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.06055 on 5 degrees of freedom
Multiple R-squared: 0.9955, Adjusted R-squared: 0.9928
F-statistic: 369.2 on 3 and 5 DF, p-value: 2.753e-06
ここで、四半期変数の係数の時間の影響、およびグループBまたはグループC(グループAではなく)にいることの影響を明確に見ることができます。
これがあなたを正しい方向に向けることを願っています。