質問へのコメントで明らかになったように、データは発芽までの時間の4つの観察のみで構成されています。(それらを16の独立した値であるかのように分析するのは誤りです。)それらは正確な時間ではなく時間の間隔で構成されます。
[1,8], [8,16], [16,24], [24,32]
いくつかのアプローチがあります。魅力的で非常に一般的なのは、これらの間隔を言葉どおりに使用することです。芽の破裂の実際の時間は、各間隔内の何でもかまいません。したがって、「不確実性」は、サンプリングの不確実性(おそらく今年は種の代表的なサンプルであると考えられます)と観測の不確実性(間隔によって反映されます)の2つの形式で表されます。
サンプリングの不確実性はおなじみの統計手法で処理されます。中央値を推定するように求められ、統計的仮定に応じてさまざまな方法で推定できます。推定値の信頼区間を提供できます。簡単にするために、バーストの発芽までの時間に対称的な分布があると仮定しましょう。これは(おそらく)非負であるため、分散があることを意味し、4つの観測値の平均でもほぼ正規分布している可能性があることを示唆しています。さらに、対称性は、平均を中央値のサロゲートとして使用できることを意味します(元の質問で求められています)。これにより、標準的でシンプルな推定および信頼区間法にアクセスできます。
(1+8+16+24)/410.25(8+16+24+32)18
Mean=[10.25,18].
これは、推定の間隔全体を表しています。間隔入力を使用した計算の適切な結果です!
1−αx=(x1,x2,x3,x4)ms
ucl(x,α)=x+tn−1(α)s/n−−√.
ucl((1,8,16,24),.025)28.0758ucl((8,11.676,16,24),.025)=25.8674まだ小さいです。観測値と一致するすべての可能な値の組み合わせの中でuclを最大化および最小化することにより、(たとえば)
ucl(data,.025)=[25.8,39.3]
(これは、信頼区間ではなく、区間値のuclを表す数値の区間です!)そして、信頼下限については、
lcl(data,.025)=[0,6.2].
00
言い換えれば、
「これらの観察は、正確に測定された場合、中央値の2.5%信頼限界の上限が39.3日と高くなる可能性がある値と一致していますが、それ以上ではありません。値と一致しています(最初とは異なる場合があります)。これにより、2.5%の信頼限界が0まで下がります。」
これをどうするかは、個々の熟考の問題であり、アプリケーションによって異なります。芽の破裂が40日より前に発生することを合理的に確認したい場合、この結果はある程度の満足感を与えます(芽の破裂の分布と観測値の独立性に関する仮定を条件とする)。芽の爆発を最も近い日に推定したい場合、明らかにより多くのデータが必要です。他の状況では、間隔値の信頼限界に関するこの統計的結論はイライラするかもしれません。 たとえば、芽の破裂が30日前に標本の50%で発生することをどの程度確信できますか 答えは間隔になるので、言うのは難しいです。
この問題を処理する方法は他にもあります。特に、最尤法の使用を推奨します。(ここでそれらを適用するには、間隔カットポイントがどのように確立されたかについてもっと知る必要があります。それらがデータとは無関係に決定されたかどうかが重要です。)この質問は、間隔ベースの方法を導入する良い機会であると思われます。特定の分野(リスクの評価とアルゴリズムの分析)では、一部の人々によって温かく支持されてきたにもかかわらず、それらはよく知られていないようです。