必ずしも正規分布から得られたとは限らないデータがいくつかあります。グループ間の同等性の検定を実行したいと思います。通常のデータには、TOST(2つの片側t検定)のような手法があります。通常ではないデータのTOSTに類似したものはありますか?
必ずしも正規分布から得られたとは限らないデータがいくつかあります。グループ間の同等性の検定を実行したいと思います。通常のデータには、TOST(2つの片側t検定)のような手法があります。通常ではないデータのTOSTに類似したものはありますか?
回答:
Wald型のtおよびzテスト統計に使用されるTOSTのロジック(つまり、それぞれおよび)は、記号のようなノンパラメトリックテストのz近似に適用できます。、符号ランク、およびランク合計のテスト。簡単にするために、同値は単一の項で対称的に表現されていると想定していますが、私の答えを非対称の同値の項に拡張するのは簡単です。
これを行うときに発生する問題の1つは、等価項(たとえば、)をと同じ単位で表現することに慣れている場合、等価項は特定の符号、符号付きランクの単位で表現する必要があることです。またはランク合計統計量。これは、両方とも乱雑であり、Nに依存します。
ただし、TOST等価条件を検定統計量自体の単位で表すこともできます。もし、TOSTにそれを考える、次いで、及び。我々が許可すれば、次いで、及び。(ここで表される統計は、どちらも右側で評価されます:および。)zの単位を使用するP 1 = P (Z > z 1)p 2 = P ( 代替はしきい値を符号付きランクまたはランク合計の単位で定義するため、同等性/関連性のしきい値を定義する分布は、ノンパラメトリックテストに適している可能性があります。これは、研究者にとって実質的に意味がなく、解釈が難しい場合があります。
(対称同値区間の場合) z_ TOST帰無仮説を棄却することができないことを認識した場合、それに応じて同値項の適切なサイズの決定を進める可能性があります。たとえば、です。
このアプローチは、Stata のパッケージtost(Shapiro-WilkテストとShapiro-Franciaテストの特定のTOST実装を含む)の連続性修正などのオプションを使用して実装されており、Stataと入力してアクセスできます。
編集:TOSTのロジックが健全であり、等価テストの形成がオムニバステストに適用されている理由は、私の解決策がShapiro-WilkおよびShapiro-Franciaテストのおおよその統計の深い誤解に基づいているということです。
それ自体はTOSTではありませんが、Komolgorov-Smirnov検定を使用すると、サンプル分布と指定できる2番目の参照分布との差の有意性を検定できます。このテストを使用して、特定の種類の異なる分布を除外できますが、一般的には異なる分布は除外できません(少なくとも、考えられるすべての代替案のテスト全体でエラーインフレを制御しなければ...それが何らかの形で可能であれば)。通常のように、任意の1つのテストの対立仮説は、あまり一般的でない「キャッチオール」仮説のままです。
2つのグループが同等に分布しているという帰無仮説である2つのグループ間の分布の差の検定を解決できる場合、Komolgorov-Smirnov検定を使用して1つのグループの分布を他のグループの分布と比較できます。それはおそらく従来のアプローチでしょう:統計的に有意でない場合は違いを無視し、テスト統計でこの決定を正当化します。
いずれの場合も、帰無仮説を拒否するための「オールオアナッシング」アプローチから生じるいくつかのより深い問題を検討する必要がある場合があります。このような問題の1つは、クロス検証済みで、ここで非常に人気があります:「正常『基本的に役に立たない』テストされていますか」という質問と回答正常テストの質問へのような人々 :「なぜあなたはこれをテストしたいです」私は、その意図は一般的にテストの理由を無効にすることであり、最終的に正しい方向に導く可能性があると思います。ここでリンクした質問に対する有用な回答の要点は次のようです。
同等性のテストを続行したい場合は、同等性テストを含む相互検証に関するもう1つの一般的なディスカッションを次に示します。
fail to
/ reject
アプローチが確立されているという事実にもかかわらず、ほとんどのサンプルは、ヌルが真である可能性を完全に排除することはできません。拒否を主張した場合、ほとんどの場合、誤った拒否エラーが発生する可能性があります。これは通常、文字通り必要ではありません。それはおそらく、私が最初に意図したより重要なポイントでした。うまくいけば、削除されたものがない今はもう少し明確になっています
set.seed(123)
p <- replicate(1000, { ## generate data under the null
x <- rnorm(100)
g <- sample(0:1, 100, replace=T)
BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)
与える
> mean(p)
[1] 0.034
一方、私たちが取る場合:
set.seed(123)
p <- replicate(1000, { ## generate data under the null
x <- rnorm(100)
g <- sample(0:1, 100, replace=T)
x <- x + 0.4*g
BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)
与える:
> mean(p)
[1] 0.437
NHSTの場合と同様に、決定的な結論を下す前にシミュレーションで調査する必要のある電力と誤検出エラー率の微妙な問題があります。
同様の(おそらくより一般的な方法)は、ベイジアン統計を使用して、いずれかの確率モデルで推定された事後を比較しています。