1
ECDFの信頼限界
PythonのデータからECDF(および信頼限界)を作成しようとしています。ECDFはnumpy、をソートして使用することで、かなり簡単に生成できlinspaceます。しかし、適切な信頼限界が何であるかは完全にstatsmodelsはわかりません。また、境界を計算する組み込みライブラリはないようです(ECDFを与えるだけのようです)。 ポイントごとの信頼限界が必要な場合1 - α1−α1-\alphaそれを使用するのが適切であるDKWの不平等をして、私の地域を計算します Cん(α )=12 nログ(2α)−−−−−−−−−−√、Cん(α)=12んログ(2α)、C_n(\alpha) = \sqrt{\frac{1}{2n}\log\left(\frac{2}{\alpha}\right)} \,, どこ んんnサンプルの観測数は何ですか?したがって、F(x )F(バツ)F(x) 私のECDFです。私の上限と下限は U B(x)=min(1 、F(x )+Cん(α ))UB(バツ)=分(1、F(バツ)+Cん(α))\mathrm{UB}(x) = \min\left(1, F(x)+C_n(\alpha)\right) L B(x)=max(0 、F(x )−Cん(α ))LB(バツ)=最高(0、F(バツ)−Cん(α))\mathrm{LB}(x) = \max\left(0, F(x)-C_n(\alpha)\right) MATLABには組み込み関数ECDFがありますが、境界を生成するためにGreenwoodの公式(下を参照)を適用する方法を理解するのにあまり運がありませんでした。