私が思いついた概念的な問題で大きな問題を抱えています。
ある会社が非常に歪んだ分布をしているとしましょう。指数関数または対数正規関数に似たもので、さらに極端なもの。ここで、分布が歪んでいると仮定して、分布の平均が分布の99%パーセンタイルよりも高くなるようにします。(別名1-2の極端に高い値により、他の分布と比較して平均が非常に高くなりました)。
定義により、この分布が将来の値(別名分布からのランダムサンプル)を予測するために使用された場合、平均が95%予測間隔に含まれないのは本当ですか?
私の脳では、95%の予測間隔は、すべての将来の値の95%がその間に入る範囲です。どの分布でも、これは下限の.025パーセンタイル、および上限の.975パーセンタイルに正確に等しい必要があります...平均が.975パーセンタイルよりも高い場合、平均は'95%内にありません。予測間隔」。
私はこれを間違って考えていますか?予測を次のように報告するのは奇妙に思えます
- 平均予測値:6,000,0000
- 95%予測間隔:[400,5000]。