信頼楕円の本当の意味

12

95％信頼楕円の真の意味について読むと、2つの説明に出くわす傾向があります。

データの95％を含む楕円
上記ではなく、データの分散を説明する楕円。正しく理解できるかどうかはわかりませんが、新しいデータポイントが入ってくると、95％の確率で新しい分散が楕円にとどまることを意味するようです。

光を当てることはできますか？

confidence-interval ellipse

— ケニー
ソース

15

実際、どちらの説明も正しくありません。

信頼楕円は、2変量分布の真の母集団平均のように、観測されていない母集団パラメーターに関係しています。この平均の95％信頼楕円は、実際には次の特性を持つアルゴリズムです：基礎となる分布からサンプリングを何度も複製し、そのたびに信頼楕円を計算する場合、そのように構築された楕円の95％には基礎となる平均。（もちろん、各サンプルは異なる楕円を生成することに注意してください。）

したがって、通常、信頼楕円には観測値の95％が含まれません。実際、観測値の数が増えると、通常、平均はより良く推定され、信頼楕円はますます小さくなり、実際のデータの割合はますます小さくなります。（残念ながら、データの95％を含む最小の楕円を計算する人もいます。これは、変位値を連想させますが、それだけで十分です。しかし、この「変位楕円」を「信頼楕円」と呼びます。ご覧のとおり、混乱を招きます。）

基礎となる母集団の分散は、信頼楕円に関連しています。分散が大きいということは、データがいたるところにあることを意味するため、平均が十分に推定されていないため、分散が小さい場合よりも信頼楕円が大きくなります。

もちろん、推定したい他の母集団パラメータについても信頼楕円を計算できます。または、特に推定パラメータが（漸近的に）正規分布していることがわからない場合は、楕円以外の信頼領域を調べることもできます。

信頼楕円の1次元の類似体は、confidence-intervalであり、このタグ内の以前の質問を参照すると役立ちます。このタグの現在のトップ投票の質問は特に素晴らしいです。95％CIが95％の平均を含む可能性を意味しないのはなぜですか？ここでの議論のほとんどは、1次元の信頼区間の高次元の類似物についても同様に当てはまります。

— ステファン・コラッサ
ソース

1

この概念が適用される領域に依存します。上記のことは統計についても当てはまりますが、他の主題に統計を適用する場合、状況は少し異なります。たとえば、生体力学では、被験者が力のプラットフォーム上に立っているときの圧力変位の中心を測定する手法として、信頼楕円という用語を使用します（予測楕円であるかどうかについては議論があります）。次に、2つの軸（長軸と短軸）の周りに描かれる楕円には、試行の時間にわたる圧力変位の中心を表すデータポイントの95％が含まれていると想定されます。

— キャスリン・カッツィギアニ
ソース