各時点でN = 14カウントの時系列データがあり、Gini係数と各時点でのこの推定の標準誤差を計算したいと考えています。
私は各時点でN = 14カウントしかないので、ジャックナイフの分散、つまりvar (G )= n − 1を計算しました。トムソンOgwangの式7から標準誤差」ジニ指数とを計算する便利な方法」。ここで、G(N、kは)要素なしでN値のジニ係数であり、K及び ˉ G(X)の平均値であるG(N、K)。
上記の分散の式の直接の単純な実装。
calc.Gini.variance <- function(x) {
N <- length(x)
# using jacknifing as suggested by Tomson Ogwang - equation 7
# in the Oxford Bulletin of Economics and Statistics, 62, 1 (2000)
# ((n-1)/n) \times \sum_{k=1}^n (G(n,k)-\bar{G}(n))^2
gini.bar <- Gini(x)
gini.tmp <- vector(mode='numeric', length=N)
for (k in 1:N) {
gini.tmp[k] <- Gini(x[-k])
}
gini.bar <- mean(gini.tmp)
sum((gini.tmp-gini.bar)^2)*(N-1)/N
}
calc.Gini.variance(c(1,2,2,3,4,99))
# [1] 0.1696173
Gini(c(1,2,2,3,4,99))
# [1] 0.7462462
これは小さなNにとって妥当なアプローチですか?他に何か提案はありますか?
多くの人が提供されたリンクにある論文にアクセスできない場合があるため、サンプル推定と標準誤差の両方に使用している実際の計算を追加できます。
—
枢機卿