順列ベースのp値に必要な順列の数


8

有意水準順列ベースの値を計算する必要がある場合pα、いくつの順列が必要ですか?

5ページの記事「分類子のパフォーマンスを研究するための順列テスト」から:

実際には、上限は通常、テストの望ましい精度を達成するために必要なサンプル数を決定するために使用されます。1/(2k)

...ここで、は順列の数です。k

この式から必要な順列の数を計算するにはどうすればよいですか?

回答:


12

私は認めます、段落は混乱するかもしれません。

順列検定を実行するときは、p値を推定します。問題は、p値の推定自体にとして計算されるエラーがあることです。p(1p)k

それで、信頼できる推定値を得るためにいくつの置換kが必要ですか?

P[p3P,p+3P]

上限を使用する

12kp1pk

12kP

14P2k

しかし、引用された式は上限を表すため、このアプローチは非常に大雑把です。

有意水準での誤差の使用

α

この場合、を知りたいα1αkP

α1αP2k

α[pPp+P]

信頼区間の拡張

このアプローチは、信頼区間の中心が決定しきい値で正しいことに対応しています。推定されたpの信頼区間の上限を決定しきい値(より正確です)未満にするためには、...

lα1αkP

l2α1αP2k

ここで、lは対応します(もう一度グラフィックを参照してください)

| l | confidence interval |
| 1 | ~68 % |
| 2 | ~95 % |
| 3 | ~99 % |

例: 希望する精度Pを0.005とします。

k> =10000

α=0.05k> =7600

α=0.01

最後に、モンテカルロシミュレーションについてさらに詳しく説明することを強くお勧めします。ウィキペディアがスタートです。


おかげで、私はこれをリードしました:epibiostat.ucsf.edu/biostat/sen/statgen/… そして私はそれをあなたが書いた方法と比較しようとしています。あなたの意見の違いは何ですか?
ネプチューン

1α
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.