@cardinalがコメントで回答を電報で送信しました。肉付けしましょう。彼の要旨は、変数間の関係を評価することを意図した一般的な線形モデル(lm
この例では、この場合はglmRob
)が表示されているように見えますが、単一の変数を研究するための強力なツールにもなり得ます。トリックは、定数に対するデータの回帰が、その平均値( "場所")を推定するもう1つの方法であるという事実に依存しています。
例として、ポアソン分布のデータをいくつか生成します。
set.seed(17)
x <- rpois(10, lambda=2)
この場合、R
は、平均ポアソン分布からの値のベクトルを生成します。その場所を推定する:2(1,5,2,3,2,2,1,1,3,1)x
2glmRob
library(robust)
glmrob(x ~ 1, family=poisson())
この応答は、切片がと推定されていることをます。もちろん、統計的手法を使用する人は誰でもそれがどのように機能するかを知る必要があります。ポアソンファミリで一般化線形モデルを使用する場合、標準の「リンク」関数は対数です。これは、切片が推定位置の対数であることを意味します。したがって、計算します0.7268
exp(0.7268)
その結果、は快適に近づきます。手順はうまくいくようです。何が行われているかを確認するには、データをプロットします。22.06852
plot(x, ylim=c(0, max(x)))
abline(exp(0.7268), 0, col="red")
当てはめられた線は完全に水平であるため、垂直値の中央、つまりデータを推定します。それだけです。
堅牢性を確認するために、最初の値にいくつかのゼロを追加して、悪い外れ値を作成してみましょうx
。
x[1] <- 100
今回は、後処理の柔軟性を高めるために、次の出力を保存しますglmRob
。
m <- glmrob(x ~ 1, family=poisson())
推定平均を取得するには、次のように要求できます
exp(m$coefficients)
今回の値は等しくなり。(として取得された)の平均値がことを考えると、少し離れていますが、それほど離れていません。これが、この手順が「堅牢」であるという意味です。詳細情報は、122.496x
mean(x)
12
summary(m)
その出力番組の外れ値に関連した重みというとりわけ私たち、、にはちょうどである、ほとんど、疑いの外れ値を特定します。0.02179 0100x[1]
0.021790