ポアソン分布の信頼水準を計算する方法は?


32

どれだけ自信があるかを知りたい。ポアソン分布の上限と下限の信頼レベルを設定する方法を知っている人はいますか?λ

  • 観測値()= 88n
  • サンプル平均()= 47.18182λ

これに対する95%の信頼度はどのようになりますか?


推定値のブートストラップを検討することもできます。ここにブートストラップの短いチュートリアルがあります。
マークTパターソン

回答:


27

ポアソンの場合、平均と分散は両方ともです。ラムダ周辺の信頼区間が必要な場合は、標準誤差をとして計算できます。λλ/n

95%信頼区間は、λ ± 1.96 λ^±1.96λ^/n


26
nλnλ=4152

4
私のように混乱している他の人のために:ここでは1.96の由来を説明します。
mjibson

2
whuberから提供されたWebサイトの情報を基に、この問題の正確な間隔をどのように計算しましたか?そのサイトは、サンプルが1つしかない場合の処理​​方法のみを示しているように見えるため、追跡できませんでした。単純なことを理解していないだけかもしれませんが、私の分布はlambda(n)の値がはるかに小さいため、正規近似を使用できず、正確な値を計算する方法がわかりません。どんな助けも大歓迎です。ありがとう!

ここでは、平均値の標準偏差を使用していますか?つまり、SE = sig/sqrt(N) = sqrt(lam/N)?これは、単一の値の標準偏差がsigポアソン分布からランダムなサンプルを引き出す可能性について教えてくれるのに対し、SE上記で定義したようにlam、それを推定するために使用したサンプルの数から、
AlexG

17

このペーパーでは、ポアソン分布の平均の信頼区間を計算する19の異なる方法について説明します。

http://www.ine.pt/revstat/pdf/rs120203.pdf


2
ここでのmodの通知にもかかわらず、測定されたポアソンシステムを評価する方法については一般的なコンセンサスよりも少ないことを指摘しているため、この回答は現状のままです。
カールウィットソフト

7

他の人が提供した答えに加えて、この問題に対する別のアプローチは、モデルベースのアプローチによって達成されます。中心極限定理アプローチは確かに有効であり、ブートストラップされた推定値は、小さなサンプルとモードの仕様ミスの問題から多くの保護を提供します。

λ

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

ポアソンglmの自然パラメーターは対数相対レートであるため、これは非対称の間隔推定値です。カウントデータが右に傾く傾向があるため、これは利点です。

上記のアプローチには式があり、それは次のとおりです。

exp(logλ^±1nλ^)

この信頼区間は、ポアソンデータの自然パラメーター(ログ)スケールの最尤推定から得られるという意味で「効率的」であり、公称95%のカバレッジを維持しながらカウントスケールに基づく信頼区間よりも厳しい信頼区間を提供します。 。


+1効率とは異なる形容詞を使用すると思います(または、より明確に言うと、計算またはゴルフの効率を意味します)。whuberのコメントは、正確な間隔を与えるリソースを指し、glmアプローチは漸近的な結果にも基づいています。(しかし、より一般的であるため、このアプローチをお勧めします。)
アンディW

μ

1
その式に対するあなたの権限は何ですか。引用できますか?
pauljohn32

@AndyW:あなたのリンクは、迅速なシミュレーションには有効ではありません
pauljohn32

1
@ pauljohn32は、特に指数ファミリーに関するCasella Bergerのテキストをチェックします。ログレートは自然なパラメーターです。
AdamO

5

ポアソン分布からの観測を考えると、

  • カウントされるイベントの数はnです。
  • λσ2

ステップバイステップ、

  • λ^=nλ
  • n>20σ

stderr=σ=λn

さて、95%信頼区間は、

I=λ^±1.96 stderr=n±1.96 n

[編集]質問データに基づいた計算、

  • λ

    元の質問では実験やデータの取得方法に関するコンテキストが提供されていないため、この仮定を立てています(統計データを操作する際に最も重要です)。

  • 95%信頼区間は、特定のケースでは、

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

したがって、測定値(n = 88イベント)は95%信頼区間外にあるため、次のように結論付けます。

  1. プロセスがポアソンプロセスに従っていない、または

  2. λ


λ/n


1
λnλ

2
λλ

2
上記のjose.angel.jiminezの回答は間違っており、元の質問を読み間違えたためだと思います。元のポスターには「観測(n)= 88」と記載されていました。これは観測された時間間隔の数であり、全体または間隔ごとに観測されたイベントの数ではありません。88の観測間隔のサンプルでの間隔ごとのイベントの平均数は、元のポスターによって指定されたラムダです。(私はこれをJoseの投稿へのコメントとして含めましたが、サイトにはあまりにも新しいのでコメントできません。)
user44436

@ user44436は、コメントと思われる回答を追加しました。それをコメントとして再投稿し、あなたがそれを見ることができるように、そして、非回答としてそれが削除されるかもしれないので:------- 私は上記のホセによる応答は間違っており、元の質問を誤読することから生じると思います。元のポスターには、観測(n)= 88-これは観測された時間間隔の数であり、全体または間隔ごとに観測されたイベントの数ではありませんでした。88の観測間隔のサンプルでの間隔ごとのイベントの平均数は、元のポスターで指定されたラムダです。
Mörre
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.