人口は、病気にかかる危険にさらされているすべての人々の(仮想の)セットです。通常、それは調査地域に居住するすべての人々(または明確に識別可能な人々のサブグループ)で構成されます。この母集団は研究の対象であり、データから作成されるすべての推論の対象であるため、この母集団を明確に定義することが重要です。
疾患の症例が独立しており(疾患が人々の間で容易に伝達されておらず、地域の環境条件によって引き起こされていない場合の合理的な仮説かもしれません)、それらがまれである場合、カウントはポアソン分布に厳密に従う必要があります。この分布の場合、標準偏差の適切な推定値はcountの平方根です。
(180 、90 、45 、210 )(13.4 、9.5 、6.7 、14.5 )出来事、季節の間に観察される病気の実際の数はその本当の率から変わる。真の(ただし不明!)レートの平方根は、発生する可能性のある変動の量を定量化します。観測されたカウントは真のレートに近いはずなので、それらの平方根は真のレートの平方根の合理的なプロキシでなければなりません。これらのプロキシは、まさに「標準エラー」が意味するものです。
1657714.577
9(20 、10 、5 、23 )( 4.5 、3.2 、2.2 、4.8 )9(40 、28.5 、20 、 44 )
これは、これらの限られたデータを使用できる限りです。これらの簡単な計算により、次のことが明らかになりました。
人口を特徴付けることは重要です。
カウントの平方根は、標準誤差を評価するための大まかな開始点です。
病気の場合の独立性の欠如を反映するために、平方根に(大まかに)何らかの要因を掛ける必要があります(そして、この要因はおおよそ病気のクラスターのサイズに関係します)。
これらのカウント間の変動は、主に不確実性ではなく、基礎となるポアソン強度に関する疾患率の変動を反映しています。