バイアスされたサンプリングによる指数分布のパラメーター推定


8

偏った条件下でこの分布から抽出されたサンプル母集団から、指数分布のパラメーターを計算したいと思います。私の知る限り、n個の値のサンプルの場合、通常の推定量はです。しかし、私のサンプルは次のように偏っています:E - λ X λ = Nλeλxλ^=nxi

指数分布からiidで描かれたm個の要素の完全な母集団から、n個の最小の要素だけが知られています。このシナリオでパラメータをどのように推定できますか?λ

もう少し厳密に言うと、がから抽出されたiidサンプルである場合、すべてのに対してあり、私は推定することができる方法をセットから。E - λ X I < J X IX jの λ { X 1X 2X 3x n } n < m{x1,x2,x3,...,xm}eλxi<jxixjλ{x1,x2,x3,...,xn}n<m

どうもありがとう!

マイケル


1
の値を知っていますか?m
jbowman

3
これはタイプIIの打ち切りです(en.wikipedia.org/wiki/Censoring_%28statistics%29)。ここで、生存分析の通常の可能性がタイプIIの打ち切りメカニズムにも当てはまることを示すことができます。
ocram

1
との役割は、この回答の途中で入れ替わったように見えます。nmn
枢機卿、

ありがとう、あなたは正しい。問題の説明でmとnの役割を修正しました。
Michael

回答:


8

タイプII打ち切りの下での指数分布のパラメーターの最尤推定量は、次のように導出できます。サンプルサイズはであると想定します。このうち最小のが観測され、最大のは観測されていません(存在することがわかっています)。n < m m nmn<mmn

(表記を簡単にするために)観測されたが順序付けされていると仮定します:。次に、の結合確率密度は次のとおりです。 0 X 1X 2X N 、X 1... XがNxi0x1x2xnx1,,xn

f(x1,,xn)=m!λn(mn)!exp{λi=1nxi}exp{λ(mn)xn}

ここで、最初の指数は観測された確率に関連し、2番目はよりも大きい観測されていない確率に関連します(これは1-のCDF です)。x i m n x i x n x nnximnxixnxn

f(x1,,xn)=m!λn(mn)!exp{λ[i=1n1xi+(mn+1)xn]}

(の係数には「」があるため、合計はなります。)ログを取り、次にwrtなどの導関数を使用すると、最尤推定量が得られます。n1+1xnλ

λ^=n/[i=1n1xi+(mn+1)xn]


1
いい答えです。偶然の質問と比較して、とを入れ替えましたか?mn
Neil G

2
@NeilG-ありがとう!テキストのOPが「要素の完全な母集団から描画されます... 最小のだけが知られている」から最後のに切り替わったことに気づきました。編集で使用している表記を明確にします...n m < nmnm<n
jbowman

2

これは、@ jbowmanの回答を私のコメントにリンクします。つまり、一般的な作業の仮定の下で、タイプIIの打ち切りの下で「標準生存可能性」を使用できます。

> #------seed------
> set.seed(1907)
> #----------------
> 
> #------some data------
> t <- sort(rexp(n=20, rate=2))        #true sample
> t[16:20] <- t[15]                    #observed sample
> delta <- c(rep(1, 15), rep(0, 5))    #censoring indicator
> data <- data.frame(t, delta)         #observed data
> #---------------------
> 
> #-----using @jbowman's formula------
> 15 / (sum(t[1:14]) + (5 + 1)*t[15])
[1] 2.131323
> #-----------------------------------
> 
> #------using the usual survival likelihood------
> library(survival)
> fit <- survreg(Surv(t, delta)~1, dist="exponential", data=data)
> exp(-fit$coef)
(Intercept) 
   2.131323 
> #-----------------------------------------------

PS1:これは指数分布に限定されないことに注意してください。

PS2:詳細は、Lawlessによる本のセクション2.2に記載されています。


1

が既知であると仮定すると、推定値はn

X K 0 < K < MのKΦ(xk)=1eλxk(k/n) ここで、、は、削減されたデータセットの番目に小さい値を指します。xk0<k<mk

ロジックは次のとおりですサンプルのセット全体がある場合、このサンプルから経験的CDF、構築できます。次に、このソートされた配列の項目を取得すると、CDF値対応します。多くの場合、が有効な選択肢です。Φ K K / N K = N / 2nΦkk/nk=n/2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.