経験的CDFの信頼区間


14

ランダムプロセスから100個のデータポイントがあります。推定値の周りに信頼区間を配置するにはどうすればよいですか?分布関数は不明であり、正に歪んでいます。私の最初の傾向は、このクラスで読んだ資料に基づいてブートストラップを使用することですが、これを行う他の方法はありますか?Pr(X>x)

回答:


14

はい、他のタイプの信頼区間(CI)があります。最も人気のあるCIの1つは、Dvoretzky–Kiefer–Wolfowitzの不等式に基づいています。

P[supバツ|F^nバツFバツ|>ϵ]2exp2nϵ2

そして、レベル\ alphaの区間を構築したい場合は、\ alpha = 2 \ exp(-2n \ epsilon ^ 2)等式αするだけで、\ epsilon = \ sqrt {\ dfrac {1} {2n}になります。 \ log \ left(\ dfrac {2} {\ alpha} \ right)}。したがって、F(x)の信頼帯はL(x)= \ max \ {\ hat {F} _n(x)-\ epsilon、0 \}およびU(x)= \ min \ {\ hat {F } _n(x)+ \ epsilon、1 \}。詳細を調べて、これをP [X> x] = 1-F(x)に適合させることができます(これを自習用としてタグ付けしたため)。α=2exp2nϵ2ϵ=12nログ2αFバツLバツ=最大{F^nバツϵ0}うんバツ={F^nバツ+ϵ1}P[バツ>バツ]=1Fバツ

このプレゼンテーションでは、興味深いと思われるその他の詳細を提供します。


これをありがとう。この不平等は私のクラスの資料のどこでも説明されていないので、彼らが実際に探しているものかどうかはわかりません。これが最終的に彼らが探していた答えであるかどうかは、これは非常に便利ですが、私の問題の解決につながるはずです。
エリックブレイディ

おもしろいと思います。ECDFの漸近的な正規性を研究しましたか?

いいえ。これは、ここで取り上げた資料には含まれていません。このクラスでは、推定されたパラメーターと変位値の信頼区間のみを調査しました。教科書やメモに基づいた人口割合の推定値を使用してこの問題を解決することは「想定」されていると思いますが、これが適切かどうかはまだわかりません。それが私がまだこれを正しいとマークしていなかった唯一の理由です。
エリックブレイディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.