誤差範囲は信頼区間とどのように関連していますか？

11

エラーのマージンと信頼区間の違いを誰かに教えてもらえますか？インターネットでは、これら2つの意味が同じ意味で使われているのがわかります。

言うのは正しいですか

「信頼区間は1.96と表示され、グラフ上に誤差範囲として表示されますか？」

confidence-interval survey polling

— ミンツ
ソース

1

このトピックに関する有用な議論は、私たちのサイトを検索することで見つけることができます。

— whuber

13

私たち皆が知っているように、インターネットはゴミでいっぱいです。信頼できるソースを見つけ、それらに焦点を当てて、そのような問題を解決するのに役立ちます。パンフレットで公表され、アメリカ統計協会（フリッツScheurenに起因すると「徹底的1997年頃の更新は」）を定義（右、P。64）95％信頼区間などのエラーのマージンを。

これを踏まえると、このパンフレットを参照しているにもかかわらず、Wikipediaのエラーマージンに関する記事で別の定義が使用されているのは驚くべきことです！ウィキペディアは書いています、

通常、誤差範囲は、調査の特定の統計の信頼区間の「半径」（または幅の半分）として定義されます。...単一のグローバルな誤差範囲が調査に対して報告される場合、それは調査からの完全なサンプルを使用して報告されたすべてのパーセンテージに対する最大の誤差範囲を指します。

言い換えれば、ウィキペディアに環境省があるの半分の最大の（被覆率は95％と異なる場合があります）信頼区間のセットの幅。

この混乱（または、少なくとも標準化の欠如）については、このサイトの他の場所のコメントで説明しています。私たちの結論は、ということでしたあなたは何を明確にする必要があるあなたは、あなたがその用語を使用するとき、「誤差の範囲」の意味します。

— whuber
ソース

7

「マージン」が何であるかについて普遍的に続いている慣習はありませんが、私は（あなたが観察したように）それが最も頻繁に信頼区間の半径を意味するものとして使用され、推定の元のスケールまたはパーセンテージのどちらかで見積もりの。「標準エラー」の同義語として使用されることもあるので、使用時に他の人があなたの意味を理解するように注意する必要があります。

「信頼区間」には、その意味に関する普遍的な慣習があります。それは基本的に、推定プロセスによって生成される可能な推定の範囲であり、X％（95％が最も一般的に使用される）の時間は推定されるパラメーターの真の値を含みます。時間の真の値X％を生成する「プロセス」のこの概念は少し直観に反するものであり、ベイズ推論の「信頼区間」と混同しないでください。これははるかに直感的な定義ですが、広く使用されている信頼区間とは異なります。

あなたの実際の見積もりは少し乱雑で、説明されているようにいくつかのマイナーな修正が必要です。私はこの「マージン」という言葉の追加の使用を避け、「エラーバー」を支持します。そう：

「信頼区間は、1.96に関連する標準誤差を掛けたものと推定され、エラーバーとしてグラフに表示されます。」

（これは、これが信頼区間を計算するための適切な方法であるかどうかという質問を脇に置きます。これはモデルなどに依存し、関連しません）

用語についての最後のコメント-「標準誤差」は好きではありません。これは単に「推定値の標準偏差」を意味します。または一般に「サンプリングエラー」-「エラー」ではなく、ランダム性と統計の分散の観点から考える方が好きです。しかし、私は上記の「標準エラー」という用語をあまりにも広く使用されていると思います。

— ピーターエリス
ソース