サンプルが大きい場合にT分布を使用して平均を推定してみませんか?


17

基本統計コースでは、標本サイズnが大きい(通常は30または50を超える)場合に、正規分布を使用して母集団パラメーターの平均を推定することをお勧めします。スチューデントのT分布は、サンプルの標準偏差の不確実性を考慮して、より小さいサンプルサイズに使用されます。サンプルサイズが大きい場合、サンプルの標準偏差は母標準偏差に関する適切な情報を提供し、正規分布の推定を可能にします。わかった。

しかし、信頼区間を正確に取得できるのに、なぜ推定値を使用するのでしょうか?サンプルサイズに関係なく、T分布で正確に得られるものの単なる推定値である場合、正規分布を使用するポイントは何ですか?


@Glen_bはい、それは区間推定量になります。これらの間隔について:「母標準偏差(σ)がわからず、サンプルサイズが小さい(n <30)場合、問題を処理する際にt分布表を使用する必要があります」(web.pdx.edu/~stipakb/からdownload / PA551 / NormalVersusTdistribution.doc)。母集団の標準偏差がわからない場合(n> 30の場合でも)、人々は常にT分布を使用しないのはなぜですか?
Pertinax 14

回答:


15

タイトルとの関係を明確にするために、t分布を使用して(少なくともポイント推定の意味で)平均を推定するのではなく、その間隔を構築しています。

しかし、信頼区間を正確に取得できるのに、なぜ推定値を使用するのでしょうか?

それは良い質問です(厳密に t分布であるという仮定が実際には成り立たないため、「正確に」に固執しすぎない限り)。

「母標準偏差(σ)が不明で、サンプルサイズが小さい(n <30)場合に問題を処理する場合は、t分布表を使用する必要があります。」

母集団の標準偏差がわからない場合(n> 30の場合でも)、人々は常にT分布を使用しないのはなぜですか?

アドバイスは、せいぜい誤解を招く可能性があると考えています。状況によっては、自由度がそれよりもかなり大きい場合でも、t分布を使用する必要があります。

t

サンプルサイズが本当に大きい場合、信頼区間に顕著な違いはありませんが、n = 30が常に「本当に大きい」に十分に近いとは思いません。


tn


2
n=30α=5%

1
@StéphaneLaurentほとんどの目的では5%で問題ありませんが、そのような判断は個人次第です。状況があります-私は今日1つだけに遭遇しました-そのレベルのエラーで問題になります。
-Glen_b-モニカを復活14

2
@StéphaneLaurentVEジョンソン(2013)からある程度の洞察を得られるかもしれません。統計的証拠の改訂基準国立科学アカデミー論文集、110(48):19313–19317。後でこの記事フィットなぜほとんど発表された研究成果は、偽である研究の批判(ラ・ どのように科学がうまくいかない
アレクシス

4
@StéphaneLaurentあなたの記事は私の質問に答えます。記録については、その結論の大まかな翻訳:「スチューデントのt分布の近似値として正規分布を使用することは、20世紀の技術的制限の結果です。これらの制限は、現代の統計ソフトウェアではなくなりました。これらの非保守的な近似を使用する理由」。
Pertinax 14

2
@TheThunderChimp警告:母集団の分散がわかっている場合(母集団の割合の推定-二分変数の平均など)、t分布ではなく標準正規分布(z)が適切です。
アレクシス14

7

それは歴史的な時代錯誤です。統計にはそれらの多くがあります。

コンピューターを持っていなかった場合、t分布を使用するのは難しく、正規分布を使用する方がはるかに簡単でした。サンプルサイズが大きくなると、2つの分布は似たものになります(「大きい」の大きさは別の質問です)。


1
それは、より深い質問に対する非常に浅い答えのようです。
アレクシス

2
よく分からない。それが理由だとは思わない?(最も賛成の答えは同じポイントになります-より雄弁で精巧に。)
ジェレミーマイル14

1
あなたの答えが私に次のように読めるので、私はダウン票を投じました。あなたの質問の簡単な要約。
アレクシス14

2
知らせてくれてありがとう-理由を知らなかったのは匿名の投票よりもいい。
ジェレミーマイルズ14

3
歴史的には、これらの分布をテーブルで値を検索することで「使用」していました。正規分布を使用する方が簡単だった唯一の方法は、自由度に対応する列を選択する必要がなかったことです。それはほとんど心配ではありません。何やった制限の使用は、いくつかの点で、それは大きな自由度にテーブルを拡張するために意味をなさないということであった:書籍が大きくなりすぎてしまいます。
whuber

1

ex2n


1
tを推定する際の数値誤差は、どのサイズで使用することで得られるゲインを上回りますか?
ジョナ14

2
確かに、t値を任意の精度で計算できるため、比較する量と同じくらい正確になります。
ニールG 14

「言い換えれば、「正確な」t値は「正確な」ものではなく、近似誤差内では、値は標準法線のCDF値と同じです。」これが信頼できる経験則かどうかはわかりません。
シャドウトーカー14

2
25.9325×1016

1
Whuber、あなたは正しい。「数値エラー」を不適切に使用しました。数値を処理するすべてのエラーを意味しました:積分の数値近似、有限精度で動作するための数値エラー、切り捨てによる数値エラー。無限の精度で作業できる場合、t分布を正規のものに置き換える正当な理由はありません
VictorZurkowski
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.