2つの箱ひげ図から5つの数値の要約(最小、Q1、中央値、Q3、最大)があり、2つの箱ひげ図のグループの平均が有意に異なるかどうかをテストしたいと思います。
t検定を使用してこれを実行したいのですが、使用できるデータがありません(5つの数値の要約のみ)。
平均の違いをテストする方法はありますか?またはt検定の大雑把な近似?また、私はサンプルサイズと平均を知っています。
2つの箱ひげ図から5つの数値の要約(最小、Q1、中央値、Q3、最大)があり、2つの箱ひげ図のグループの平均が有意に異なるかどうかをテストしたいと思います。
t検定を使用してこれを実行したいのですが、使用できるデータがありません(5つの数値の要約のみ)。
平均の違いをテストする方法はありますか?またはt検定の大雑把な近似?また、私はサンプルサイズと平均を知っています。
回答:
標本平均があり、仮説は母集団平均に関連しているので、以下の例では間違いなく標本平均を使用したいと思います。
いくつかの分布の前提があれば、確かにどこかに行くことができます。
サンプルサイズが非常に大きい場合、IQRを推定値にスケーリングするために分布を仮定し、それをz検定として扱うことができます。(ただし、n = 30は実際には「大」ではありません)
たとえば、正規性を仮定する場合、母集団の四分位範囲は約1.35であるため、サンプルが十分に大きく、母集団IQRがほとんど誤差なしで推定される場合、を推定して、法線で効果的な検定を行うことができます。
この場合、分散が等しいと想定しないと、、次に計算します場合、、 Zテーブルを調べます。
[チェックとして、サイズ30の通常のサンプルを生成するシミュレーションを行いました(計算ではそれを想定していませんが、分散は同じです)。テストは保守的です(つまり、タイプIエラー率はしたがって、5%テストを実行しようとすると、6.8%の領域のどこかに実際に到達しているように見えます(分散が異なる場合、近似はおそらく少し悪くなります)。それを許容できる場合は、おそらくそれで問題ありません。もちろん、保守主義を補うために有意水準を下げることもできますが、弾丸を噛んでオプション2を試す傾向があります。ただし、サンプルサイズが200程度になると、これはかなりうまくいきます。]
どちらかのサンプルサイズが大きくない場合でも、何かを行うことはできますが、統計の分布は、四分位数が計算された正確な方法と特定のサンプルサイズによって異なります。
特に、あなたはどちらか
a。等しい分散を想定し、等分散のt統計と同様の検定統計量を使用しますが、2つのIQRの二乗の加重平均に基づいて推定を使用します。または
b。分散が等しいと仮定せず、Welch-Satterthwaiteタイプの統計に類似した検定統計を使用しないでください。
最初のケースでは、テスト統計の分布は、仮定された分布からのシミュレーションによってかなり簡単に取得できます。(2番目のケースでは、分布はスプレッドの違い方に依存するため、状況は少し複雑になりますが、何かを行うことはできます。)
あなたは、いくつかの分布の仮定を作るために準備していない場合、あなたはまだできバインド標本標準偏差をので、t統計上の上限と下限を取得します。ただし、境界はあまり狭くない場合があります。
サンプル平均がなかった場合は、t検定のアナログで中央値を使用できます。正規性(または単に対称性と平均の存在さえも)を仮定している場合、中央値はそれぞれの平均を推定します。ただし、平均の違いのみを処理する必要があるため、これをテストとして機能させるには、かなり弱い仮定で十分です。
この場合、シミュレーションを介して非常に簡単に重要な値(または実際にはp値)を取得できますが、通常の仮定でのnull分布はt分布にかなり近いです。p値へのかなりまともな近似値はtテーブルから取得できますが、適切な自由度はt検定から得られるよりもかなり低く(半分に近い!)、検定統計量はスケーリングする必要があります。同様に、分散は正確に対応していません。
これは通常では特に優れたパワーを持ちませんが、正常性からの逸脱に対して優れた堅牢性を備えています。
例として、この形式の統計の場合:
ここでサンプルの中央値であり、およびサンプルの四分位範囲である(に類似している特定の形態に等しい分散と等しいための2つの標本t検定の)。サイズ30と30の40,000サンプルをシミュレートしました。
絶対値と値の絶対値()のQQプロットが下(灰色)にプロットされ、45度の線が緑色で描画されます。2番目のプロットは、典型的な有意水準(1%から10%の間の値を含むがこれに限定されない)の領域の詳細を示しています。近似値は、その範囲のほとんどで約3桁まで正確です。
[同様のプロットが、それぞれの近傍の他のさまざまな自由度(適切に選択された)について取得されます。さまざまなサンプルサイズでのシミュレーションでは、t分布の近似は、等分散、等サンプルサイズの場合に、広い範囲にわたって適切に機能することが示唆されています。等分散でサンプルサイズが等しくない場合は、t分布による近似で十分だと思いますが、必要なシミュレーションと分析にはかなり時間がかかります。]