グループの違いがないという仮説をテストする方法は?


39

数値従属変数(例:知能テストのスコア)を調べる2つのグループ(例:男性と女性)での研究があり、グループに違いがないという仮説があるとします。

質問:

  • グループの違いがないかどうかをテストする良い方法は何ですか?
  • グループの違いがないことを適切にテストするために必要なサンプルサイズをどのように決定しますか?

初期の考え:

  • 帰無仮説を棄却できないからといって、対象のパラメーターがゼロに近い、またはゼロに近いわけではないため、標準のt検定を行うだけでは十分ではありません。これは、特に小さなサンプルの場合です。
  • 95%の信頼区間を見て、すべての値が十分に小さい範囲内にあることを確認できました。たぶんプラスまたはマイナス0.3標準偏差。

「これは帰無仮説が真であると仮定する」とはどういう意味ですか?
ロビンジラール

「違いがある」と間違って宣言する確率を制御できるようにするには、2つの仮説を分離する必要があります(すでに引用したとおり、この引用が大好きです:stats.stackexchange.com/questions/726/… ;))
ロビンジラール

@Robin帰無仮説有意性検定のp値は、帰無仮説が真であると仮定した場合に観測されるデータ以上の極端なデータと見なされる確率です。しかし、おそらく私は上記の声明をよりうまく表現できたでしょう。
ジェロミーアングリム

@Robin私は私のポイントを明確にしようとする問題を修正
Jeromy Anglim

回答:


20

同等性のテストについて質問していると思います。基本的に、2つのグループが実質的に同等であると結論付けるためには、差がどれだけ許容できるかを決定する必要があります。この決定により、95%(またはその他の)信頼区間の制限が定義され、これに基づいてサンプルサイズの計算が行われます。

トピックに関する本全体があります。

同等性テストの非常に一般的な臨床的「同等」は、非劣性テスト/試験です。この場合、あるグループを他のグループよりも「優先」し(確立された治療)、新しいレベルの治療が統計的証拠のあるレベルで確立された治療より劣らないことを示すテストを設計します。

私は信用する必要があると思うハーヴェイMotulskyをするためにGraphPad.com(下サイト「ライブラリ」)。


16

既に述べた、ある種の同等性テストの可能性に加えて、それらのほとんどは、私の知る限りでは、古き良き周波数主義の伝統でほとんどルーティングされていますが、実際に証拠の定量化を提供するテストを行う可能性があります帰無仮説、すなわちベイジアン検定を好む。

ベイジアンt検定の実装は、ここで見つけることができます:Wetzels、R.、Raaijmakers、JGW、Jakab、E.、&Wagenmakers、E.-J. (2009)。帰無仮説に対する支持と反対の支持を定量化する方法:デフォルトのベイジアンt検定の柔軟なWinBUGS実装。Psychonomic Bulletin&Review、16、752-760。

Rでこれをすべて行う方法に関するチュートリアルもあります。

http://www.ruudwetzels.com/index.php?src=SDtest


この論文では、Kruschkeによって、ベイジアンt検定の代替(おそらくより現代的なアプローチ)が(コード付きで)提供されています。

クルシュケ、JK(2013)。ベイズ推定はt検定に優先しますJournal of Experimental Psychology:General、142(2)、573–603。doi:10.1037 / a0029146


この答え(Kruschkeが追加される前)のすべての小道具は、同僚のDavid Kellenに送ってください。この質問から彼の答えを盗んだ。


誰かがベイジアンアプローチを提供してくれるかどうか疑問に思っていました。優れた。ありがとう。
ジェロミーアングリム

1
Rの素晴らしいBayesFactorパッケージへの参照を含めるために、この回答を更新する価値があるかもしれません。
crsh


8

私が知っているいくつかの論文があります。

トライオン、WW(2001)。推論信頼区間を使用した統計的差異、等価性、および不確定性の評価:帰無仮説統計検定を実施する統合代替方法。Psychological Methods、6、371-386。(無料PDF

訂正:
Tryon、WW、およびLewis、C。(2008)。Tryon(2001)の低減係数を修正する統計的同等性を確立する推論信頼区間方法。Psychological Methods、13、272-278。(無料PDF

さらに:

シーマン、マサチューセッツ州&セルリン、RC(1998)。平均の2グループ比較の E 等価信頼区間。Psychological Methods、Vol 3(4)、403-411。


このトピックに関する多くの論文や本さえあります。
マイケルチャーニック

7

最近、2つの分布の平均ではなく、2つの分布間の距離に基づいた「等価性テスト」の代替方法について考えました。

2つのガウス分布の重なりに信頼区間を提供する方法がいくつかあります。ここに画像の説明を入力してください

OP1P2P1P2

1OP1P2=TVP1P2
TVP1P2=supA|P1AP2A|P1P2

OP1P2>0.9P1P20.110

μ1μ2

|μ1μ2|TVP1P2

|μ1μ2|σ


いくつかの実際の問題で重複が使用されていることを示すリソースはありますか?これは信じられないほど有望に聞こえますが、実際の問題にどのように適用するかは明確ではありません(ここでの結論は、「この分布はXに非常に似ています」からいくつかのステップが削除される可能性があるため、どのようにそれを見るのが少し難しくなります) 10%のテレビは、推論への影響の大きさに換算されます)。
スタンピージョーピート

1
:私は私のブログに同じ精神で何かを書かれている@StumpyJoePete stla.github.io/stlapblog/posts/...
ステファン・ローラン

5

医学では、2つの片側検定(tost)ではなく、信頼区間アプローチを使用することが望ましいです。また、非常に明確にするために、ポイント推定値、CI、および事前に決定された等価マージンをグラフ化することをお勧めします。

あなたの質問はおそらくそのようなアプローチで対処されるでしょう。

この点に関して、非劣性/同等性の研究に関するCONSORTガイドラインは非常に有用です。

Piaggio G、Elbourne DR、Altman DG、Pocock SJ、Evans SJ、およびCONSORT Groupを 参照してください非劣性および同等性のランダム化試験の報告:CONSORTステートメントの延長。JAMA。2006年3月8日; 295(10):1152-60。(全文へのリンク。)


1
信頼区間が優先されるとは限りません。実際、信頼区間は仮説検定に対応しています。TOSTは、手順で使用される2つの片側t検定に対応する2つの片側信頼区間を交差させることにより得られる信頼区間を調べることで達成できます。
マイケルチャーニック

4

はい。これは等価テストです。基本的には、帰無仮説と対立仮説を逆転させ、平均値の差が等価のウィンドウ内にあることを示すために、標本サイズを検出力に基づいています。ブラックウェルダーはそれを「帰無仮説の証明」と呼んだ。これは一般に、市販薬とジェネリック薬の同等性がテストされるか、承認された薬が新しい製剤と比較される製薬臨床試験で行われます(多くの場合、生物学的同等性と呼ばれます)。片側バージョンは非劣性と呼ばれます。場合によっては、新薬が市販の競合他社より劣っていないことを示すだけで、薬を承認することができます。ShaoとPigeotは、クロスオーバーデザインを使用した生物学的同等性に対する一貫したブートストラップアプローチを開発しました。


0

2つのサンプルグループ間のブートストラップの違い(平均間の違いなど)を統計的有意性を確認します。別のコンテキストではありますが、このアプローチのより詳細な説明は、http://www.automated-trading-system.com/a-different-application-of-the-bootstrap/にあります。


1
あなたは、差がないという帰無仮説受け入れ、2つの量が同等であるという証拠を見つけるという誤りを融合しています
アレクシス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.