非正規データの同等性テスト?


9

必ずしも正規分布から得られたとは限らないデータがいくつかあります。グループ間の同等性の検定を実行したいと思います。通常のデータには、TOST(2つの片側t検定)のような手法があります。通常ではないデータのTOSTに類似したものはありますか?


1
私はTOSTに詳しくありませんが、マンホイットニーを探していますか?これは、2つのグループが異なる分布に由来するという証拠を提供する可能性がある(分布についての仮定が行われないという意味で)ノンパラメトリック検定です。
Nick Sabbe 2013年

1
私は、帰無仮説が違いがあるという仮説であり、対立仮説は違いが(ほとんど)ないというテストを探しています。
ライアンC.トンプソン

小さなサンプルの場合は、stats.stackexchange.com / questions / 49782 /…で回答を確認することができます。より大きなサンプルの場合、Central Limit定理のおかげで、t検定を使用した従来のアプローチで問題ありません。
Michael M

3
「2つの片側テスト」という語句には何もありません。基礎となるロジックも通常の理論を意味しません。それを非正規分布の位置シフト代替に適応させることは完全に可能であるはずです。しかし、注意してください-多くの場合、非通常のデータで実際に必要なのは、スケールシフトの種類の同等性テストであり、他の種類のデータでは、代わりに何か他のものです。実際に何が必要かを知ることは、何を測定していて、どのような問題を解決しているかによって異なります。ペグを丸い穴に押し込もうとするのではなく、ペグを検査するのに役立ちます。
Glen_b-モニカを2014

回答:


8

Wald型のtおよびzテスト統計に使用されるTOSTのロジック(つまり、それぞれおよび)は、記号のようなノンパラメトリックテストのz近似に適用できます。、符号ランク、およびランク合計のテスト。簡単にするために、同値は単一の項で対称的に表現されていると想定していますが、私の答えを非対称の同値の項に拡張するのは簡単です。θ/sθθ/σθ

これを行うときに発生する問題の1つは、等価項(たとえば、)をと同じ単位で表現することに慣れている場合、等価項は特定の符号、符号付きランクの単位で表現する必要があることです。またはランク合計統計量。これは、両方とも乱雑であり、Nに依存します。Δθ

ただし、TOST等価条件を検定統計量自体の単位で表すこともできます。もし、TOSTにそれを考える、次いで、及び。我々が許可すれば、次いで、及び。(ここで表される統計は、どちらも右側で評価されます:および。)zの単位を使用するz=θ/σθz1=Δθ/σθz2=θ+Δ/σθε=Δ/σθz1=εzz2=z+εP 1 = P Z > z 1p 2 = P p1=PZ>z1p2=PZ>z2 代替はしきい値を符号付きランクまたはランク合計の単位で定義するため、同等性/関連性のしきい値を定義する分布は、ノンパラメトリックテストに適している可能性があります。これは、研究者にとって実質的に意味がなく、解釈が難しい場合があります。

(対称同値区間の場合) z_ TOST帰無仮説を棄却することができないことを認識した場合、それに応じて同値項の適切なサイズの決定を進める可能性があります。たとえば、です。εz1αε=z1α+0.5

このアプローチは、Stata のパッケージtost(Shapiro-WilkテストとShapiro-Franciaテストの特定のTOST実装を含む)の連続性修正などのオプションを使用して実装されており、Stataと入力してアクセスできます。

編集:TOSTのロジックが健全であり、等価テストの形成がオムニバステストに適用されている理由は、私の解決策がShapiro-WilkおよびShapiro-Franciaテストのおおよその統計の深い誤解に基づいているということです。


3

それ自体はTOSTではありませんが、Komolgorov-Smirnov検定を使用すると、サンプル分布と指定できる2番目の参照分布との差の有意性を検定できます。このテストを使用して、特定の種類の異なる分布を除外できますが、一般的には異なる分布は除外できません(少なくとも、考えられるすべての代替案のテスト全体でエラーインフレを制御しなければ...それが何らかの形で可能であれば)。通常のように、任意の1つのテストの対立仮説は、あまり一般的でない「キャッチオール」仮説のままです。

2つのグループが同等に分布しているという帰無仮説である2つのグループ間の分布の差の検定を解決できる場合、Komolgorov-Smirnov検定を使用して1つのグループの分布を他のグループの分布と比較できます。それはおそらく従来のアプローチでしょう:統計的に有意でない場合は違いを無視し、テスト統計でこの決定を正当化します。

いずれの場合も、帰無仮説を拒否するための「オールオアナッシング」アプローチから生じるいくつかのより深い問題を検討する必要がある場合があります。このような問題の1つは、クロス検証済みで、ここで非常に人気があります:「正常『基本的に役に立たない』テストされていますか」という質問と回答正常テストの質問へのような人々 :「なぜあなたはこれをテストしたいです」私は、その意図は一般的にテストの理由を無効にすることであり、最終的に正しい方向に導く可能性があると思います。ここでリンクした質問に対する有用な回答の要点は次のようです。

  1. パラメトリックテストの仮定の違反が心配な場合は、代わりに分布の仮定を行わないノンパラメトリックテストを見つける必要があります。ノンパラメトリック検定を使用する必要があるかどうかはテストしないでください。使うだけ!
  2. 「私の分布は著しく非正規ですか?」という質問を置き換える必要があります。「私の分布はどのように非正規であり、これは私の興味の分析にどのように影響する可能性が高いですか?たとえば、中心傾向(特に平均を含む)に関するテストは、尖度よりも歪度に敏感であり、(共)分散に関するテストではその逆になります。それでも、ほとんどの分析目的には、どちらの種類の非正規性にもあまり敏感ではない堅牢な代替手段があります。

同等性のテストを続行したい場合は、同等性テストを含む相互検証に関するもう1つの一般的なディスカッションを次に示します。


1
0|θθ0|Δ01θθ0Δ01θθ0Δ0102Δ<θθ0<Δ[ΔΔ]

けっこうだ; 私はおそらく少し誤解を招くものでした。あなたが反対していると思われる部分を削除しました。しかし、あなたはコメントを少し強く言いすぎたと思います。強制二分法fail to/ rejectアプローチが確立されているという事実にもかかわらず、ほとんどのサンプルは、ヌルが真である可能性を完全に排除することはできません。拒否を主張した場合、ほとんどの場合、誤った拒否エラーが発生する可能性があります。これは通常、文字通り必要ではありません。それはおそらく、私が最初に意図したより重要なポイントでした。うまくいけば、削除されたものがない今はもう少し明確になっています
Nick Stauner

2
00+0+00+0Δ0+00+0

もちろん、感度と特異性、PPVとNPVの問題は消えません。
Alexis 14

-1

H0fバツfyH1fバツ=fyH0fバツN01f^バツf^yバツ=Yfyfバツ

H0H1

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

与える

> mean(p)
[1] 0.034

p

一方、私たちが取る場合:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  x <- x + 0.4*g
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

与える:

> mean(p)
[1] 0.437

NHSTの場合と同様に、決定的な結論を下す前にシミュレーションで調査する必要のある電力と誤検出エラー率の微妙な問題があります。

同様の(おそらくより一般的な方法)は、ベイジアン統計を使用して、いずれかの確率モデルで推定された事後を比較しています。


2
AdamO「同等性のテスト」と「同等性のテスト」を混同しているようです。後者の方法と応用には、数十年前の確かな文献があります。
Alexis

1
たとえば、Wellek、S.(2010)を参照してください。同等性および非劣性の統計的仮説のテスト。チャップマンとホール/ CRCプレス、第2版。
Alexis

@Alexisうーん、残念ながらライブラリにアクセスできません。マージン内にある推定値が同等と見なされる限り、同等性は非劣性と同じであると言っていますか?
AdamO

1
完全ではない:非劣性とは、新しい治療が、ある標準からアプリオリに指定され最小の関連する差を差し引いても悪くないかどうかの一方的なテストです。同等性のテストは、2つ(またはそれ以上)の量が(いずれかの方向で)先験的に指定され最小の関連する差よりも異なるという帰無仮説のテストです。いくつかの独創的な論文:
Alexis

シューマン、DA(1987)。2つの片側テスト手順と平均バイオアベイラビリティの同等性を評価するためのパワーアプローチの比較Journal of Pharmacokinetics and Biopharmaceutics、15(6):657–680。
Alexis
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.