間隔の和集合で切り捨てられた正規分布


8

打ち切られた正規分布を見つけたいが、区間で定義されているのではなく、 (a,b)ここで、、その定義は間隔にある、。<a<b<(a,b)(c,d)<a<b<c<d<

まず第一に、これは切り捨てられた正規分布の定義を依然として満たしますか?これに関するWikipediaの記事でを使用してそれを定義しています。ここで、および(Xは通常、平均および分散) 。打ち切られた正規分布ではない場合、それは何ですか?(a,b)<a<b<a<X<bμσ2

それが打ち切られた正規分布である場合、どのように計算しますか?全確率の法則を使用してそれに近づくことができると考えていましたが、切り捨てられた分布を、ユニオンの各間隔の切り捨てられた正規分布の0.5倍として取得しましたが、これは実際には意味がありません。これは、Xが最大の確率で取ることができる値が1つあるのではなく、等しい確率で分布に2つのピークがあることを意味します(私が間違っている場合を除きます)。

回答:


10

あなたが説明しているのは切り捨てられた正規分布それ自体ではありませんが、その確率密度関数と累積分布関数は、一般的に切り捨てられた分布扱うのと同じ方法で簡単に計算できるため、曲線の下の残りの領域でそれらを分割する必要がありますつまり

a<xb  c<xdf(x)dx=[F(b)F(a)]+[F(d)F(c)]

ここで、は切り捨てられていない密度、は切り捨てられていない累積分布関数です。これは、任意の数のそのような間隔に一般化できます。f(x)F(x)

そのような分布の密度は

g(x)={f(x)F(b)F(a)+F(d)F(c)for a<xb  c<xd0otherwise

自分を納得させるために、簡単なシミュレーションでこの結果を簡単に確認できます(以下を参照)。

ここに画像の説明を入力してください

set.seed(123)

m <- 0
s <- 1
a <- -2
b <- -1
c <- 1
d <- 2

x <- rnorm(1e5, m, s)
y <- x[(x > a & x <= b) | (x > c & x <= d)]

g <- function(x, mean = 0, sd = 1, a, b, c, d) {
  ifelse((x > a & x <= b) | (x > c & x <= d),
         dnorm(x, mean = mean, sd = sd) /
           ((pnorm(b, mean = mean, sd = sd) - pnorm(a, mean = mean, sd = sd)) +
              (pnorm(d, mean = mean, sd = sd) - pnorm(c, mean = mean, sd = sd))),
         0)
} 

xx <- seq(-4, 4, by = 0.01)
hist(y, 100, xlim = c(-4, 4), freq = FALSE)
lines(xx, g(xx, m, s, a, b, c, d), col = "red")
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.