アップデート2014-01-15
無効にされた間接的に調整された比率のエラーマージンがACSの同じレートのエラーマージンより大きいか小さいかについてのダニカの元の質問に答えなかったことに気づきました。答えは次のとおりです。会社のカテゴリの比率が州のACSの比率と大幅に異ならない場合、以下に示す誤差範囲はACSの誤差範囲よりも小さくなります。理由:間接レートは、組織の職種の個人数(または相対比率)を固定数として扱います。無効になっている割合のACSの見積もりには、事実上、それらの割合の見積もりが必要であり、これを反映して誤差範囲が増加します。
例として、無効レートを次のように記述します。
P^a dj= ∑ n私んp私^
p^私私
一方、ACSの推定レートは、実際には次のとおりです。
P^acs=∑(NiN)ˆpi^
NiNNi/Ni
Ni/Npi
SE(P^adj)>SE(P^acs)N1/N=0.7345N2/N=0.2655SE(P^acs)=0.0677
n1/nn2/nSE(P^adj)=0.0375n1/n=0.15n2/n=0.85SE(P^adj)=0.0678SE(P^acs)n1/n=0.001n2/n=0.999SE(P^adj)=0.079
アップデート2014-01-14
短い答え
私の意見では、CIまたはエラーのマージン(CIの長さの半分)なしでそのような統計を提示することは無責任だと思います。これらを計算するには、ACS Public Use Microdata Sample(PUMS)(http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/)をダウンロードして分析する必要があります。
長い答え
これは、実際にはACSの再重み付けではありません。これは、間接標準化のバージョンであり、疫学の標準的な手順です(グーグルまたはエピテキストを参照)。この場合、州のACSジョブ(カテゴリ)障害率は、組織のジョブカテゴリの従業員数によって重み付けされます。これにより、組織内の予想される障害者の数が計算さE
れ、観察された数と比較することができますO
。比較のための通常のメトリックは、標準化された比率R= (O/E)
です。(通常の用語は「標準化された死亡率」の「SMR」ですが、ここでは「結果」は障害です。)R
また、観察された障害率(O/n)
と間接的に標準化された率の比でもあります。(E/n)
ここn
で、は組織の従業員数です。
この場合、必要なのはCIのみ、E
またはE/n
必要となるため、それから始めます。
もし
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
その後
E = sum (n_i p_i)
の分散E
は次のとおりです。
var(E) = nn' V nn
ここnn
で、は組織カテゴリ数の列ベクトルでV
あり、ACSカテゴリの障害率の推定分散共分散行列です。
また、ささいに、 se(E) = sqrt(var(E))
そしてse(E/n) = se(E)/n
。
Eの90%CIは
E ± 1.645 SE(E)
で分割しn
て、のCIを取得しE/n
ます。
推定var(E)
するには、ACS Public Use Microdata Sample(PUMS)データ(http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/)をダウンロードして分析する必要があります。
var(E)
スタタでのコンピューティングのプロセスについてのみ話すことができます。利用できるかどうかはわかりませんので、詳細は延期させていただきます。ただし、Rまたは(場合によっては)SASの調査機能に詳しい人は、上記の方程式からコードを提供することもできます。
比率の信頼区間 R
の信頼区間R
は通常、のポアソン仮定に基づいてO
いますが、この仮定は正しくない場合があります。
我々は考えることができますO
し、E
そう、独立しているように
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
の計算後、さらに1つのStataステップとして計算できますvar(E)
。
ポアソン独立性の仮定の下で:
var(log O) ~ 1/E(O).
スタタのようなプログラムは、たとえば、負の二項モデルまたは一般化線形モデルに適合し、より正確な分散項を与えることができます。
のおよそ90%のCI log R
は
log R ± 1.645 sqrt(var(log R))
また、エンドポイントを累乗して、のCIを取得できますR
。