母平均から有意に離れた値の統計的検定:Z検定ですか、T検定ですか?


12

値は、値のリストと比較してどの程度重要ですか?ほとんどの場合、統計的テストには、サンプルセットと母集団の比較が含まれます。私の場合、サンプルは1つの値で作成され、母集団と比較します。

私は、おそらく最も基本的な問題に直面している統計的仮説検定のディレッタントです。1つのテストではなく、数百のテストです。パラメータースペースがあり、すべてのポイントに対して有意差検定を実行する必要があります。パラメータの組み合わせごとに、値とバックグラウンドリスト(母集団)の両方が生成されます。次に、これをp値で並べて、興味深いパラメーターの組み合わせを見つけます。実際、このp-valが高い(有意でない)パラメーターの組み合わせを見つけることも重要です。

それでは、1つのテストを行ってみましょう。選択したセットから生成された計算値と、ランダムなトレーニングセットを選択して計算された値のバックグラウンドセットがあります。計算値は0.35で、バックグラウンドセットは(おそらく?)平均0.25と非常に狭いstd(e-7)で正規分布しています。サンプルは他の何かから計算されているため、実際には分布についての知識はありません。それらはある分布からの乱数サンプルではないので、背景は正しい言葉です。

帰無仮説は、「サンプルテストの平均が計算値0.35に等しい」というものです。これをいつZ検定またはT検定と見なすべきですか?母平均よりも値を大幅に高くしたいので、片側検定です。

私はサンプルとして何を考慮するべきか少し混乱しています:1つのサンプル(観察)と母集団としてのバックグラウンドリストがあるか、私のサンプルがバックグラウンドリストであり、それを全体(非サンプリング)と比較しています帰無仮説によると同じ平均値を持つべき母集団。これが決定すると、テストは異なる方向に進むと思います。

T検定の場合、p値を計算するにはどうすればよいですか?R / Python / Excel関数を使用するのではなく、自分で計算したいと思います(その方法は既に知っています)。したがって、最初に正しい式を確立する必要があります。

まず、私は私の場合にはT検定はサンプルサイズに連結される、フォームなければならないので、T検定は、少しも一般的であると思われる:ここでZ = ˉ X

T=Z/s,
とSであり、S=σ/σ集団STDに対して、サンプルSTD。したがって、2つのケースがあります。サンプルサイズが母集団のサイズであり、これがZ検定を処理していることを「推測」するか、母集団統計(nおよびstd)が不明ですが、分布は何らかの方法で近似し、私は本当にT検定を扱っています。いずれにせよ、私の次の質問は:
Z=X¯σn
s=σ^/σ
  1. p値を計算するにはどうすればよいですか?(つまり、R / Python / Excel関数またはp値テーブルのルックアップを使用せず、実際に数式に基づいて計算します。何をしているかを知りたいので)
  2. サンプルサイズに基づいて有意しきい値を決定するにはどうすればよいですか?(式がいいでしょう)

3
1060.35=106×107+0.250.35

1
@grokkaine-この質問は興味深い問題を提起し、価値があるように見えますが、用語を非常に正確にするように注意して、少し編集するとさらに価値があると思います。
-rolando2

1つのテストではなく、数百のテストです。パラメータースペースがあり、すべてのポイントに対して有意性テストを実行する必要があります。パラメータの組み合わせごとに、値とバックグラウンドリスト(母集団)の両方が生成されます。次に、p値でこれを注文し、興味深いパラメーターの組み合わせを見つけます。実際、このp-valが高い(有意でない)パラメーターの組み合わせを見つけることも重要です。後で投稿を編集してみます。
-grokkaine

回答:


9

興味深い質問を提起します。最初に、0.35、平均0.25、および1/10 ^ 7の標準偏差(これが私がe ^ -7ビットを解釈する方法)の観測値を持っている場合、実際に仮説を立てる必要はありません。テスト演習。0.35の観測値は、0.25の平均値とは大きく異なります。これは、平均値から数千標準偏差離れており、おそらく平均値から数百万標準誤差であるためです。

Z検定とt検定の違いは、主にサンプルサイズを指します。サンプルが120より小さい場合、t検定を使用してp値を計算する必要があります。サンプルサイズがそれよりも大きい場合、どちらを使用してもそれほど違いはありません。サンプルサイズに関係なく両方の方法で計算し、2つのテストの違いがどれほど少ないかを観察するのは楽しいことです。

自分で物事を計算する限り、観測値と平均値の差を標準誤差で割ることでt statを計算できます。標準誤差は、標準偏差をサンプルサイズの平方根で割ったものです。これで、tスタットができました。p値を計算するには、テストテーブルでt値を検索する以外に方法はないと思います。単純なExcelの代替TDIST(t stat value、DF、1 or 2 for 1 or 2 tail p value)を受け入れると、トリックが行われます。Zを使用してap値を計算するには、1検定のExcel式は次のとおりです。(1-NORMSDIST(Z値)。Z値はt statと同じ(または平均から離れた標準誤差の数)。

注意点として、仮説検定のこれらの方法は、サンプルサイズによって歪む可能性があります。つまり、サンプルサイズが大きいほど標準誤差が小さくなり、結果のZ値またはt統計量が高くなり、p値が低くなり、統計的有意性が高くなります。このロジックの近道として、サンプルサイズが大きいと統計的有意性が高くなります。しかし、大きなサンプルサイズに関連する高い統計的有意性は、まったく重要ではありません。言い換えれば、統計的に重要なのは数学的なフレーズです。(ウェブスター辞書ごとに)必ずしも意味があるわけではありません。

この大きなサンプルサイズのトラップから逃れるために、統計学者はエフェクトサイズメソッドに移動しました。後者は、2つの観測間の統計的距離の単位として、標準誤差ではなく標準偏差を使用します。このようなフレームワークでは、サンプルサイズは統計的有意性に影響を与えません。効果サイズを使用すると、p値から信頼区間に移動する傾向があります。信頼区間は、簡単な英語ではより意味があります。


回答のおかげで、私はサンプルとして何を考慮するべきかについて少し混乱しています:1つのサンプル(観察)と母集団としての背景リストがあるか、私のサンプルが背景リストであり、それを比較しています帰無仮説によれば、同じ平均値を持つべきである(サンプリングされていない)母集団全体 これが決定すると、テストは異なる方向に進むと思います。
grokkaine

サンプルとしてあなたが持っているすべての観測値を使用します(それを何と呼んでも)。そして、1つの観測と定義されたサンプルの平均との間の統計的距離を計算します。サンプルの標準偏差と標準誤差を計算します。また、観測値と平均値との統計的距離は、(観測値-平均)/標準誤差= t statです。Excel TDIST関数(DF、t stat、1(片側))を使用すると、p値が取得されます。
-Sympa

5

仮説検定は常に母集団を指します。サンプルに関するステートメントを作成する場合は、テストする必要はありません(表示内容を比較するだけです)。頻繁に使用されるのは漸近性であるため、サンプルサイズが大きい限り、データの分布について心配する必要はありません。Z検定とT検定は、検定統計量の計算に関して基本的に同じことを行います。重要な値は異なる分布(正規対スチューデントT)から取得されます。サンプルサイズが大きい場合、差はわずかです。

Q1に関して:n-1の自由度(nはサンプルサイズ)のT分布から調べてください。

Q2に関して:Z検定に必要な有意水準と、T検定の場合のサンプルサイズの有意水準に基づいて、しきい値を計算します。

しかし、真剣に、いくつかの基本を確認する必要があります。


答えてくれてありがとう。実際、私が使用していたのはt-distでしたが、「なぜ」それを使用するのかも理解したかったのです。「大きな」サンプルをどのように定義し、p値はどのように異なりますか。さらに重要なことは、分布が正規であるかスチューデントtであるかをどのように知るかです。統計的検定はありますか?たぶん、2番目にkolmogorov-smirnovテストを使用し、最初に何を使用しますか?
-grokkaine

2
大... n = 60から始まるZとtが収束します。両方のテストから得たp値を比較するだけです。t /正規分布の仮定は、基礎となるデータの分布に依存しません。これは、平均のサンプリング分布が正規であるという仮定に基づいています。テストしている変数が分散ガンマであっても、それは保持されます。n = 200程度で問題なく動作するはずです。繰り返しになりますが、これらはすべて、頻度の高い統計に基づいています。
joint_p

常に人口を指す仮説検定に関するコメントに対して+1であるが、質問者のサンプルが1であるという点を見逃しているように見えるために-1
ピーターエリス

1
「計算された値とランダムに生成された値のバックグラウンドセットがあります。計算された値は0.35です」とはどういう意味なのかわかりませんでした。
joint_p 19

他の段落からのコメントの再投稿:サンプルとして何を考慮するかについて少し混乱しています:1つのサンプル(観察)と母集団としての背景リストがあるか、私のサンプルが背景リストであり、これを、帰無仮説によれば同じ平均値を持つべきである(サンプリングされていない)母集団全体と比較しています。これが決定すると、テストは異なる方向に進むと思います。
grokkaine
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.