統計を使用するタイミングと


15

信頼区間を計算するためこのビデオ講義を参照していました。ただし、混乱があります。この男は、計算に統計を使用しています。ただし、それはt統計であるはずだったと思います。母集団の真の標準偏差は与えられません。サンプルの標準偏差を使用して、真の標準偏差を推定しています。zt

それでは、なぜ彼はではなく信頼区間の正規分布を取るのでしょうか?t



参考として、t統計を使用してビデオで公開されている問題を解決すると、次のようになりn <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145ます。
アントニ・パレラダ

回答:


10

あなたは正しいです、それはt分布でなければなりません。ただし、サンプルサイズは36(つまり> 20)なので、z分布も適切です。サンプルサイズが大きくなると、t分布の形状がz分布に似てくることに注意してください。


21

最初の統計コースを受講したとき(恐竜の後、しかし実際のコンピューターがまだ部屋全体を占めていたとき)、30度以上の自由度がある場合は、zテーブルを使用するように教えられました。最大30自由度になり、tテーブルを見ると、約28自由度のどこかで、zテーブルと同じ結果が有効数字2桁になることがわかります(そして、すべてを手動で行うと、より頻繁に丸める)。おそらく、プレゼンターはまだその学校のものです。

サンプルの標準偏差をテストに使用している場合、サイズに関係なく実際にt分布を使用する必要があり(最近ははるかに簡単です)、z(標準正規)を使用するのは正しいことです母集団の標準偏差はわかっていますが、実際には、サンプルサイズが大きい場合、意味のある違いはあまり見られません。


1
大逸話:)
swiecki

z間隔を使用しても問題ない場合があるという不幸な副作用の1つは、一部の導入テキストがt間隔ではなくz間隔を提示することです。サンプルが日常的に十分に小さく、z間隔が完全に不適切である科学分野が数多くあります。私は明示的に指示して、毎年このことについて私の学生を教えてくれたが、まだそれらの相当数は、zの間隔を使用:-(
マイケル・ルー-モニカ復活

4

カーンはビデオの内容を単純化しすぎているのか、それとも間違っているのかを判断するのに苦労しています。私は後者を言わなければなりませんが、問題はzまたはtの質問ではありません。彼は、信頼区間を計算するものを呼び出してから、人口平均が所定の範囲内に収まることを92%確信していると言います。残念ながら、それは信頼区間から結論付けるものではありません。

それで、私はtzの質問に戻り、彼がそこでエラーを犯したかどうか疑問に思い始めます。サンプルが小さい場合は修正する必要があると彼が述べているからではないのではないかと思っています。そのため、他の回答者はおそらく正しいでしょう。彼はただ使っているZを、彼はすでにそれを導入しているため、それは私がすべてのビデオを通過する予定がない36のn個と密接に十分だが、私は彼が紹介します想像していたT、後でうまくいけば、次のいずれかを配布します。

カーンアカデミーが統計の非常に多くの分野で間違っているのは本当に残念です...しかし、問題のあるビデオにのみ注目されるため、そのように感じるかもしれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.