狭い信頼区間—より高い精度?


17

信頼区間について2つの質問があります。

明らかに、信頼区間が狭いということは、その区間内で観測値を取得する可能性が低いことを意味するため、精度が高くなります。

また、95%信頼区間は、99%信頼区間よりも狭くなっています。

99%の信頼区間は、95%よりも正確です。

精度と狭さのこの違いを理解するのに役立つ簡単な説明を誰かがくれますか?


2
「その間隔ので観測値を取得する可能性は小さい」ということだと思います。残念ながら、信頼区間は、技術的、統計的な問題により、意味するようには見えないかもしれませんが、一般に、区間が狭いほど(所定の信頼レベルで)、結果に関する不確実性が少なくなります。このサイトには、信頼区間(たとえば、信頼区間とは対照的に)の意味を説明するスレッドが多数あります。予測間隔に入らない
ウェイン

@Wayneなぜ声明が「 その間隔内に観測値を取得する可能性が小さい」ではないのですか?狭い間隔には大きなタイプ1エラーがあるため、真の帰無仮説を拒否する可能性が高くなります。つまり、その真のヌル値はその間隔に含まれません。だから、私にa narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalは正しいようです。どこで間違いを犯しているのか教えてください。
ユーザー31466

回答:


18

95%は、実験で真の効果をカバーしたことに対する自信に数値的にはまったく関係していません。おそらく、「95%のカバレッジ範囲の計算を使用した間隔」が、より正確な名前である可能性があることを認識しています。間隔に真の値が含まれることを決定する選択を行うことができます。一貫して95%の時間を実行すれば、あなたは正しいでしょう。しかし、詳細な情報がなければ、特定の実験にどの程度の可能性があるのか​​本当にわかりません。

Q1: 最初のクエリは2つのことをまとめ、用語を誤用します。混乱しているのも不思議ではありません。信頼区間を狭くするとより正確になる場合がありますが、95%メソッドなど、同じ方法で計算すると、すべて同じ精度になります。時間の同じ割合で真の値を取得します。

また、幅が狭いからといって、その狭い信頼区間内にあるサンプルに遭遇する可能性が低くなるわけではありません。狭い信頼区間は、3つの方法のいずれかで達成できます。実験方法またはデータの性質は、分散が非常に低い場合があります。サンプルのサイズに関係なく、海水面での水道水の沸点付近の信頼区間はかなり小さくなっています。人々は非常に多様であるため、人々の平均体重の周りの信頼区間はかなり大きいかもしれませんが、より多くの観測値を取得するだけでその信頼区間を小さくすることができます。その場合、より多くのサンプルを収集し、信頼区間を狭くすることで、真の値がどこにあると考えられるかについてより確実になると、その信頼区間で個人に出会う確率は下がります。(サンプルサイズを大きくすると、いずれにせよ低下しますが、沸騰水ケースで大きなサンプルを収集する必要はありません)。最後に、サンプルが代表的でないため、幅が狭くなる可能性があります。その場合、実際には、真の値を含まない間隔の5%のうちの1つを持つ可能性が高くなります。CIの幅と、文献とこのデータが一般的にどの程度変動するかを知ることで確認する必要があることに関しては、少し逆説的です。その場合、実際には、真の値を含まない間隔の5%のうちの1つを持つ可能性が高くなります。CIの幅と、文献とこのデータが一般的にどの程度変動するかを知ることで確認する必要があることに関しては、少し逆説的です。その場合、実際には、真の値を含まない間隔の5%のうちの1つを持つ可能性が高くなります。CIの幅と、文献とこのデータが一般的にどの程度変動するかを知ることで確認する必要があることに関しては、少し逆説的です。

さらに、信頼区間は母集団の真の平均値を推定しようとすることであると考えてください。その場所を知っていれば、さらに正確(かつ正確)になり、見積もりの​​範囲さえありません。しかし、まったく同じ値の観測値に遭遇する確率は、特定のサンプルベースのCI内で観測値を見つけるよりもはるかに低くなります。

Q2:99%の信頼区間は95%よりも広いです。したがって、本当の値が含まれる可能性が高くなります。上記の正確なものと正確なものの違いを見てください。2つを混同しています。変動幅が小さく、サンプルサイズが大きい信頼区間を狭くすると、より正確になり、可能性のある値の範囲が狭くなります。99%の計算を使用してカバレッジを増やすと、より正確になり、真の値は範囲内にある可能性が高くなります。


2
母集団の平均(=推定しようとしているもの)のばらつきはゼロです。
ニックサブベ

10

特定のデータセットについて、信頼区間の信頼レベルを上げると、間隔が大きくなります(少なくとも小さくなりません)。それは正確さや正確さではなく、本当の価値を見逃すことに対してどれだけのリスクを冒すかということです。

複数のデータセットからの同じ種類のパラメーターの信頼区間を比較しており、一方が他方よりも小さい場合、小さい方がより正確であると言えます。私はについて話をすることを好むの精度ではなく、精度(参照このような状況では、この関連するWikipediaの記事を)。


「同じ種類のパラメーター」と「複数のデータセット」とはどういう意味ですか?たとえば、非識字率に関する調査と調査は、1995年、1998年などの異なる時期に行われます。次に、「非識字率」は同じ種類のパラメーターであり、1995、1998などのデータセットは複数のデータセットを示していますか?
ユーザー31466

たとえば、各母集団の平均に対する信頼区間のセット。あなたの例も適合すると思います。
カール

3

まず第一に、特定の信頼率(例:95%)のCIは、実際のすべての目的で(技術的には正しくありませんが)、真の値が区間内にあると確信していることを意味します。

これが間隔が「狭い」場合(これは相対的な方法でのみ見なすことができるため、以下との比較のために、1ユニットの幅であると言います)、プレイする余地があまりないことを意味します:いずれの値その間隔を選択すると、真の値に近くなり(間隔が狭いため)、そのことは確実です(95%)。

これを比較的広い95%CIと比較します(前の例と一致するため、100単位の幅であると言います):ここでは、実際の値がこの間隔内にあることを95%確信していますが、それでもあまりわかりません間隔には比較的多くの値があるので(1に対して約100の係数があります-そして、単純化を無視するように純粋主義者にお願いします)。

通常、95%だけを必要とする場合よりも、真の値が99%であると確信する場合は、より大きな間隔が必要になります(注:間隔がネストされていない場合、これは真実ではない場合があります)、実際、必要な信頼性が高いほど、選択する間隔が広くなります。

一方、あなたはある高い信頼区間より確か。したがって、同じ幅の2つの間隔を指定し、一方が95%CIで、もう一方が99%CIであると言う場合、99%の間隔を希望することを望みます。この意味で、99%のCIはより正確です。真実を見逃したという疑いが少なくなります。


ありがとう!したがって、光よりも高速なニュートリノに関するこの新しい研究の信頼区間は非常に小さい(これは狭いことを意味すると思います)と言うとき、それは信頼区間が広い場合よりも正確である可能性が高いことを意味しますか?(他のすべての側面を無視)
11

10
ニック、あなたの最初の発言は間違っています。それは「技術的な問題」ではなく、単に正しくありません。信頼区間は、繰り返し実験で何が起こるかについての記述であり、95%の時間で真の値をカバーします。与えられた実験で見つかった真の値が与えられた範囲内にあるという自信についての声明は、まったく同じではありません。「その自信がある」の「あれ」と括弧で囲まれた数値を削除すると、真実に近づきます。それは、真の値が間隔内に収まる可能性が高いと信じていることを意味していると言えます。
ジョン

そうでなければ、答えはかなり良いです
ジョン

4
@John:間隔自体がランダム変数であると言うことを特に避けましたが、私の文章はそうではないことを示唆していません(確かに、そう示唆しています)。関係する問題は知っていますが、質問とは無関係であることがわかりました。私は、違いが重要である実用的な状況を見たことがないので、「すべての実用的な目的のために」。
ニックサベ

4
問題が発生していませんか?これは、p値= nullの確率を言ってから、問題が発生したことがないと言っているようなものです。適切なジャーナルに留まるなら、そうはなりません。真の値が現在の範囲にあることを95%確信していると言うのは間違っています。難解な問題として扱うことは、「少なくともこの範囲で値が95%確信している」と言う人がもう1人は歩けるようになることを意味します。答えを修正して修正することはほとんどありません。その1つのステートメントを変更した場合、回避する他の問題は無視できます。
ジョン

3

ここで、賛成票を投じた良い答えをいくつか追加します。結論を完全に明らかにするために、もう少し言うべきことがあると思います。エフロンが定義しているように、正確で正しい用語が好きです。私は非常に最近別の質問でこれについて長い議論をしました。適度なwhuberは本当にその答えを気に入りました。ここでそれを繰り返すために同じ要素には行きません。ただし、エフロンの精度は、信頼レベルと間隔の幅またはタイトさの正確さに関連しています。しかし、最初に精度を考慮することなく、タイトさについて話すことはできません。いくつかの信頼区間は、広告する実際のカバレッジを持っているため、正確です。95%信頼区間は、漸近分布を使用するため、近似することもできます。漸近に基づく近似間隔は、有限のサンプルサイズnの場合、漸近分布が正確な分布である場合に得られるカバレッジであるアドバタイズされたカバレッジを持ちません。そのため、おおよその間隔が覆い隠す(つまり、実際のカバレッジが91%であるときに95%をアドバタイズする)か、まれではあるがそれほど深刻ではないケースの覆い隠し(つまり、アドバタイズされたカバレッジは95%ですが、98%で実際に)があります。前者の場合、実際のカバレッジが広告されたカバレッジにどれだけ近いかを心配します)。近さの尺度は、精度の次数であり、1 /√nまたは1 / nと言えます。実際の信頼レベルが近い場合、正確と呼びます。Accurayは、正確ではないブートストラップ信頼区間では重要ですが、一部のバリアントは他のバリアントよりも正確です。

この精度の定義は、OPが参照しているものとは異なる場合がありますが、エフロンの定義が何であり、正確であることがなぜ重要であるかが明確になっているはずです。正確な2つの方法がある場合、いずれかの信頼レベルで予想される幅が小さい場合は、どちらか一方を優先することができます。この意味で最適な(最短と呼ばれることもある)信頼区間が選択されます。しかし、これには正確さが必要でした。信頼レベルが近似値にすぎない場合、リンゴとオレンジを比較できます。一方が他方よりも狭くなる可能性があるのは、それが精度が低く、そのために宣伝されているカバレッジよりも実際のカバレッジが低いためです。

2つの信頼区間が両方とも非常に正確であるか、1つが正確で、もう1つが非常に正確であると予想される幅を比較しても、少なくとも2つの2種類のリンゴを見ているため、大丈夫かもしれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.