svyglm vs glmでの重みの使用


18

重みの治療の間どのように異なるかを私は知っていただきたいと思いますsvyglmし、glm

twangR のパッケージを使用して、次のように重みとして使用される傾向スコアを作成しています(このコードはtwangドキュメントから取得しています)。

library(twang)
library(survey)
set.seed(1)

data(lalonde)

ps.lalonde <- ps(treat ~ age + educ + black + hispan + nodegree + married + re74 + re75,
 data = lalonde)

lalonde$w <- get.weights(ps.lalonde, stop.method="es.mean")
design.ps <- svydesign(ids=~1, weights=~w, data=lalonde)

glm1 <- svyglm(re78 ~ treat, design=design.ps)

summary(glm1)

...
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      374.4  17.853   <2e-16 ***
treat         -432.4      753.0  -0.574    0.566    

これと比較してください:

glm11 <- glm(re78 ~ treat, weights=w , data=lalonde)
summary(glm11)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      362.5  18.441   <2e-16 ***
treat         -432.4      586.1  -0.738    0.461  

したがって、パラメーターの推定値は同じですが、治療の標準誤差はまったく異なります。

どのように重みの治療は、間で異なるんsvyglmglm

回答:


11

ウェイトにはさまざまな種類があり、混乱を招きます。使用していると思われる種類の重みを使用しているさまざまな機能またはソフトウェアを使用している場合は、十分に注意する必要があります。

svyglm関数は調査の重みを使用します。これらの重みは各ケースの重要性を表し、それらを(twangの後の)代表的なものにします。glm()の重みがわからない-メジャーの精度を表していると思います。(二項族を使用している場合、意味は異なります)。

調査の重み(surveyglmで)は、正しい標準誤差を与えるために必要な重みです。

(頻度の重み、分析の重み、および重要度の重みもあります)。


(+1)ありがとう。surveyglm)のドキュメント以外の、調査の重みに関するアクセス可能なリファレンスを知っていますか?
ジョーキング


1
参照していただきありがとうございます。アクセス可能とは、オンラインで入手可能なものを意味します、申し訳ありません。私は....良いライブラリに簡単にアクセスを持っていない
ジョー・キング

うーん...何かに出くわしたことは覚えていませんが、何が見つかるかはわかります。
ジェレミーマイルズ

9

survey重みのサンプリングによって生じる精度の低下を考慮して、標準誤差を計算します。の重みはglm、最小二乗推定で誤差に与えられた重みを単純に調整するため、標準誤差は正しくありません。Lumley(2010)のセレクションは次のとおりです。

モデルベースの分析では、正しい標準誤差を得るためにモデルのランダム部分を正しく指定する必要がありますが、標準誤差の推定値はすべて設計ベースであるため、モデルに関係なく有効です。モデルベースの回帰分析で時々使用される「サンドイッチ」、「モデルロバスト」、または「不均一分散」の標準エラーは、使用する設計ベースの標準エラーとほぼ同一であることは注目に値します。主な違いは、成層化の処理にあります。

そのため、設計に階層sandwichがない場合、使用すると同一またはほぼ同一のSE推定値が得られることがわかります。

library(sandwich)
coefs <- vcovHC(glm11, type="HC0")
lmtest::coeftest(glm11,coefs)

私のテストでは、「HC0」または「HC1」を使用したときに正確に計算されませんでしたが、非常に近かったです。svyglmT値の代わりにZ値も報告するようになりました。


2
将来の読者に役立つ場合: coeftestRパッケージからlmtestです。
-swihart
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.