nが増加すると、t値は仮説検定で増加しますが、tテーブルは正反対です。どうして?


8

以下のための式仮説検定では、次式で与えられる。 T = ˉ X - μt

t=バツ¯μσ^/

場合が増加すると、T上記式に従って-value増加します。しかし、なぜdfnの関数)が増加すると、tテーブルの臨界t値が減少するのでしょうか。tttdf

回答:


9

これらは2つの異なる現象です。

  1. 統計t

    が増加する場合、他のすべてを一定に保ち、t値を単純な算術問題として増加させる必要があります。分母に分数を考えてみましょうσ / Ntnが大きくなると、σ^/平方根は単調変換であるため、 nも大きくなります(ゆっくりではあります)。nの平方根はその分数の分母であるため、大きくなると、分数は小さくなります。ただし、この部分は分母です。その結果、その分母が小さくなると、2番目の分数が大きくなります。したがって、nが大きくなると、t値も大きくなります。(再び、と仮定 σを ˉ X -μ N U LのLと同じままです。) tσ^バツ¯μあなたll

    これは概念的にどういう意味ですか?まあ、私たちが持っているデータが多いほど/サンプルサイズが母集団サイズに近づくほど、サンプルエラーが原因でサンプル平均が母集団平均から離れる傾向が少なくなります(数値の法則を参照)。人口が有限である場合、これは簡単にわかりますが、直感的ではないかもしれませんが、人口が無限である場合も同様です。サンプル平均(以降バツ¯)参照(null)値から大きく変動してはなりません。nullからのサンプル平均の観測された距離は、null値が実際にはサンプルが抽出された母集団の平均ではないためです。 。より正確には、null値が実際にサンプルが抽出された母集団の平均である場合、null値から遠く離れたサンプル平均を見つける可能性はますます低くなります。

  2. 分布t

    あなたが見てみると -table(たとえば、統計本の後ろに)、あなたが実際に見ていることの表である重要な値。つまり、そのアルファで検定が「有意」であるためには、観測されたt統計量がより大きくなければならないという値です。(通常、これらは可能なアルファの少数に対してリストされます:α = { .10 .05 .01 .001 })。このようなテーブルをよく見ると、実際には次数で考えていると思います。問題のt統計に関連する自由度。の自由度がttα={.10 .05 .01 .001}t -statisticはの関数である Nであり、 DがF = N - 2 2グループのための T検定、または D F = N - 1つのグループのために T(あなたの例では、後者のようです)検定。これは、自由度が無限大に近づくにつれて t分布が標準正規分布に収束するという事実に関係しています。 tdf=2tdf=1tt

    これを概念的に理解する方法は、最初に分布tを使用する必要がある理由について考えることです。参照平均値があなたが興味を持っていること、そしてサンプルがあなたが観察したことの意味を知っています。サンプルが抽出された母集団が正規分布している場合(人々は暗黙のうちに仮定していることが多い)、平均のサンプリング分布も正規分布していることがわかります。では、なぜ分布を気にするのでしょうか。答えは、母集団の標準偏差が何であるかがわからないということです。(我々があった場合は必ず、私たちは本当に正規分布を使用することになり、すなわち、zの代わりの検定T検定。)、tzt、未知の母集団値のプロキシとして。しかし、我々が持っているより多くのデータは、より確か我々はそれをすることができ σがある実際には、およそ正しい値。n人口規模(および/または無限大)に近づく、私たちは、ことを確認することができます σ実際には正確に正しい値。したがって、t分布正規分布になります。 σ^σ^ σ^t


それは素晴らしい長い答えです。コメントから移動して答えにしてみませんか?
Harvey Motulsky 2013年

ありがとう、@ HarveyMotulsky。後者の文はどういう意味ですか?コメントではなく回答として投稿されます。
ガン-モニカを元に戻す

土壇場で何かが変わったか、私はそれを間違って見ました。それは素晴らしい答えであり、そのように投稿されました。
Harvey Motulsky 2013年

これは、t値の式で使用したnが、臨界t値の生成に使用される式とは関係がないことを意味しますか?私が混乱しているのは、tテーブルでdf(nの関数)が増加すると、重要なt値が減少するのに対し、元の質問の式のt値ではそうではないことです。ただし、両方の場所(テーブルと式)で同じnが表示されますが、動作は異なります。
リバイアサン2013年

1
(ちなみに、私が編集したとして私の答えは、あなたの質問に対処していると信じ明確性の敷居一部不足があるのなら、私に教えてください。)
GUNG -復活モニカ

4

さて、簡単な答えは、それが数学から外れるものです。長い答えは、数学3を行うことです。代わりに、これらが2つの異なる(関連している)ものであるというGungの説明を言い換えてみます。

サンプル収集しました未知の分散で正規分布するX nバツ1バツ、その平均が特定の値 μと異なるかどうかを知りたい。あなたがこれを行う方法は、あなたの観測が仮定からどのように「異なる」を表す値を計算することである ˉ のx = μを。したがって、提示した t統計量 1の式。なぜこれが nとともに増加するのかについて考える最も直感的な方法は、サンプルが多いほど状況が異なるという「自信」があるということです。4μバツ¯=μt1

t21tt分布、df = 2,3,5,20t-valueは、曲線の下の領域が選択したいくぶん任意の値(伝統的に0.05)に等しいx位置です。これらの値は、グラフ上でポイントとしてマークされます。したがって、緑の曲線(df = 5)の場合、左側の緑のドットの左側にある曲線の下の領域= 0.025、右側の緑のドットの右側にある曲線の下の領域= 0.025、合計で0.05になります。

t

tttバツ¯=μ


計算できる多くの任意の値からこの特定の値を計算するのはなぜですか?まあ、これは尤度比検定 3の計算から外れるものです。 事前に標本の分散を知っている場合、gungによって言及された z統計(正規分布に従う)は、この計算から外れ、 z検定を実行します1
zz
2

4

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.