95%は、実験で真の効果をカバーしたことに対する自信に数値的にはまったく関係していません。おそらく、「95%のカバレッジ範囲の計算を使用した間隔」が、より正確な名前である可能性があることを認識しています。間隔に真の値が含まれることを決定する選択を行うことができます。一貫して95%の時間を実行すれば、あなたは正しいでしょう。しかし、詳細な情報がなければ、特定の実験にどの程度の可能性があるのか本当にわかりません。
Q1:
最初のクエリは2つのことをまとめ、用語を誤用します。混乱しているのも不思議ではありません。信頼区間を狭くするとより正確になる場合がありますが、95%メソッドなど、同じ方法で計算すると、すべて同じ精度になります。時間の同じ割合で真の値を取得します。
また、幅が狭いからといって、その狭い信頼区間内にあるサンプルに遭遇する可能性が低くなるわけではありません。狭い信頼区間は、3つの方法のいずれかで達成できます。実験方法またはデータの性質は、分散が非常に低い場合があります。サンプルのサイズに関係なく、海水面での水道水の沸点付近の信頼区間はかなり小さくなっています。人々は非常に多様であるため、人々の平均体重の周りの信頼区間はかなり大きいかもしれませんが、より多くの観測値を取得するだけでその信頼区間を小さくすることができます。その場合、より多くのサンプルを収集し、信頼区間を狭くすることで、真の値がどこにあると考えられるかについてより確実になると、その信頼区間で個人に出会う確率は下がります。(サンプルサイズを大きくすると、いずれにせよ低下しますが、沸騰水ケースで大きなサンプルを収集する必要はありません)。最後に、サンプルが代表的でないため、幅が狭くなる可能性があります。その場合、実際には、真の値を含まない間隔の5%のうちの1つを持つ可能性が高くなります。CIの幅と、文献とこのデータが一般的にどの程度変動するかを知ることで確認する必要があることに関しては、少し逆説的です。その場合、実際には、真の値を含まない間隔の5%のうちの1つを持つ可能性が高くなります。CIの幅と、文献とこのデータが一般的にどの程度変動するかを知ることで確認する必要があることに関しては、少し逆説的です。その場合、実際には、真の値を含まない間隔の5%のうちの1つを持つ可能性が高くなります。CIの幅と、文献とこのデータが一般的にどの程度変動するかを知ることで確認する必要があることに関しては、少し逆説的です。
さらに、信頼区間は母集団の真の平均値を推定しようとすることであると考えてください。その場所を知っていれば、さらに正確(かつ正確)になり、見積もりの範囲さえありません。しかし、まったく同じ値の観測値に遭遇する確率は、特定のサンプルベースのCI内で観測値を見つけるよりもはるかに低くなります。
Q2:99%の信頼区間は95%よりも広いです。したがって、本当の値が含まれる可能性が高くなります。上記の正確なものと正確なものの違いを見てください。2つを混同しています。変動幅が小さく、サンプルサイズが大きい信頼区間を狭くすると、より正確になり、可能性のある値の範囲が狭くなります。99%の計算を使用してカバレッジを増やすと、より正確になり、真の値は範囲内にある可能性が高くなります。