発生率の推定


8

医学生向けの統計コースを受講しているときに、発生率に関連する問題に遭遇しました。問題の背景は、ポアソン分布に関する章です。この問題では、2300人の喫煙者が1年間にわたってフォローされ、そのうち24人が肺癌を発症しています。次に、プロセスの発生率を計算し、次のように進めます。

Incidence rate=24230024/2

彼らは減算なぜ最初は、私は理解していなかった24/2、私はそれらの24人が今年中に癌を発症することから、リスクの自分の時間を開発していないものに比べて短くなっているという事実のためにいくつか修正したと仮定しました病気。少なくとも問題ではなく、教科書自体にそれ以上の情報は与えられていません。簡単な検索で、正しい方向に沿って考えていることが確認されました。

しかし、私はまだ公式の根拠を理解していません。誰かが私を啓発できますか?また、医学生にアクセス可能ないくつかの参照が与えられる可能性がある場合。さらに技術的なリファレンスがあってもかまいません。


1
私はあなたの質問を完全に理解していません-もう少し具体化できますか?発生率はそれだけであり、したがって、分母に人と時間の「接触」があります。あなたは24/2について正しいです。これは、肺がんを発症する人々が間隔の中間点でそうしたという仮定を反映しているため、6か月で検閲されます。対照的に、有病率(24/2300)を推定することはできますが、有病率は発生率と疾患期間の関数であるため、疾患の原因を特定することに関心がある場合はあまり役に立ちません。
DL Dahly

しかし、なぜこの仮定に問題がないのでしょうか。
Raskolnikov

たとえば、3か月または9か月で検閲するよりも良い仮定だからです。何らかの季節的影響、または類似の影響がない限り、最も良い推測は区間の中間点です。これを改善する唯一の方法は、より高い時間分解能でデータを収集することです。
DL Dahly

回答:


6

ポアソン過程として癌の発生をモデル化することを提案します。観察期間中、同じ個人内で複数のイベント(腫瘍の出現)が発生する可能性があります。場合年によって腫瘍の出現率で、0事象の確率はE - λ、および1つのイベント以上の確率は、P = 1 - E - λλeλp=1eλ

1年間に人の個人を追跡します。1つのイベント以上を有する個体の数は、X B I NN P 。予想される数はE X = n p = n 1 - e - λです。nXBin(n,p)E(X)=np=n(1eλ)

次に、イベントを観察し、λを推定します。第1の推定値のP = Xxλ、その後 λ =-ログ1-Xp^=xn。最尤推定量の不変性によりλのMLEですλλ^=log(1xn)xn+x22n2λ^λ

あなたの推定量は。2つの推定量の間の差は、約あり、X3/6N3であれば非常に小さい、X/N小さいです。他のモデリングが推定器に直接つながる可能性があるとしても、これはある程度の正当化を提供すると思います。x/n1x/2nxn+x22n2x3/6n3x/n


4
log(1z)log(1z)z/(1z/2)z

peλ

@Raskolnikov私の生徒たちにとって素晴らしい練習につながるこの素敵な質問に感謝します;)素敵な疑似
Elvis

@cardinalと素敵な版!
Elvis

3

癌の診断が年間を通じて均一に広がっていると仮定すると、診断された人はその診断の前に(平均して)半年間診断されるリスクにさらされます。

あなたのリンクは、観測期間の中間点での発生の仮定に言及していますが、それがどこから来たのかについては言及していません-これは単なる均一性の仮定です。この仮定は常に合理的であるとは限らず、実質的な違いをもたらすことができる場合があります。計算式を使用するときは常にその仮定に注意することをお勧めします。これは、式の適合性を検討する必要があり、適切でない場合は、推定に実質的な影響を与える可能性があるかどうか(この場合、より適切な仮定)発生について調査する必要があります)


それで、これですべてです。均一性の仮定?しかし、なぜ診断の均一性が重要なのでしょうか?(少なくともnullモデルとして)ポアソン分布である可能性が高いと私が考える病気にかかる確率はなぜですか?
Raskolnikov

均一性の仮定は、それがどこから来たのかということです。そうです、それだけです。他の情報がない場合(およびその情報がある場合でも)、それはリスクへのエクスポージャーを計算する際の一般的な仮定です。診断については、診断されていない発生率は観察されないため、データは発生率ではなく診断に関するものであると仮定しました。
Glen_b-モニカを復活させる

より明確にするために、あなたのリンクは「数理的方法」から来るものとして式に言及しています。関連する保険数理の資料は、私が認識しているすべての保険数理のシラバスでかなり標準的なリスクにさらされている要素です。均一性のその特定の仮定は、私が作ったばかりのものではありません。それは、アクチュアリーのトレーニングで絶対に明白です。あなたはそれがどこから来るのか尋ねました。リンクは保険数理法に言及しています。これは、リスクにさらされる標準的な保険数理的アプローチから生じます。
Glen_b-モニカを復活させる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.