タグ付けされた質問 「permutation-test」

帰無仮説と一致するデータの再配置に基づく統計的検定。

1
2サンプル順列検定でテールを2倍にする
2つのサンプルがあり、それらが同じ分布から抽出されたかどうかを判断したいとします。サンプルA、Bはいくつかの整数で構成されています。 これを、2サンプル順列テストを使用してテストする場合、具体的には、サンプルの平均の差が観察された差と同じくらい極端である順列を調べることにより、両側p-を計算できると考える理由はありますか?片方の尾を見て確率を2倍にすることで価値は? これは私の講義ノートで言われているように見えますが、尾が対称的であると仮定できる理由(またはそれがなぜその仮定を伴わないのか)がわかりません。説明は迫っていませんでした。

1
単一のサンプルを平均と比較する順列検定
人々が単一のサンプルを平均と比較するために順列テストを実装する場合(たとえば、順列t検定で行うように)、平均はどのように処理されますか?順列テストの平均とサンプルを取る実装を見てきましたが、それらが実際に内部で何をしているのかは不明です。仮定された平均に対して1つのサンプルの順列検定(たとえば、t検定)を行う意味のある方法さえありますか?または、代わりに、それらはデフォルトで非置換テストにデフォルトで設定されていますか?(たとえば、順列関数を呼び出すか、順列テストフラグを設定しても、デフォルトで標準のt検定または同様の関数に設定されます) 標準の2サンプル順列検定では、2つのグループがあり、ラベルの割り当てをランダム化します。しかし、1つの「グループ」が想定されている場合、これはどのように処理されますか?当然のことながら、仮定された平均自体にはサンプルサイズがありません。それでは、平均を順列形式に変換する典型的な方法は何ですか?「平均」サンプルは単一点と見なされますか?サンプルグループと同じサイズのサンプルですか?無限サイズのサンプル? 仮定された平均が仮定されていることを考えると、それは技術的には無限のサポート、または仮定したいサポートが技術的にあると言えます。ただし、どちらも実際の計算にはあまり役立ちません。値がすべて平均に等しい、同じサイズのサンプルは、いくつかのテストで時々行われるもののようです(たとえば、ペアの残りの半分に想定される位置を入力するだけです)。これは、仮定された平均が分散なしで正しかったかどうかを確認できる長さの等しいサンプルであるため、少し意味があります。 だから私の質問はこれです:実際には、2番目のセットが平均(または同様の抽象的な仮定値)である場合、人々は実際に置換テストスタイルのラベルのランダム化をエミュレートしますか?もしそうなら、人々はこれを行うときにラベルのランダム化をどのように処理しますか?

1
順列テストを使用する利点は何ですか?
検定統計量によって代替仮説に対するいくつかのヌルをテストする場合U(X)U(X)U(X)、ここで、X={xi,...,xn}X={xi,...,xn}X = \{ x_i, ..., x_n\}、の順列の集合を使用して順列検定を適用すると、新しい統計 X T (X ):= #{ π ∈ G :U (π X )≥ U (X )}GGGXXXT(X):=#{π∈G:U(πX)≥U(X)}|G|.T(X):=#{π∈G:U(πX)≥U(X)}|G|. T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}. 順列検定を使用しない場合と比べて、順列検定を使用する利点は何ですか?つまり、順列テストが機能するときはどのようなものですか? それを実現するための条件は何ですか?検定統計量および/または帰無仮説に関するいくつかの条件など?UUU 例えば、 サンプル場合、 は基づくp値と等しい必要がありますか?はいの場合、なぜですか?(参照も高く評価されています)U (X )XT(X)T(X)T(X)U(X)U(X)U(X)XXX のp値は、。順列検定がU(X)の順列分布を推定する場合| X = x、T(X)はX = xでのU(X)の p値とどのように等しいですか?特に、ヌルHには複数の分布が存在する可能性があり、T(X)はヌル分布を1つずつ考慮せず、\ sup_ {F \ in H}と\ …

1
フィッシャーの正確確率検定(順列検定)の意外な動作
いわゆる「厳密検定」または「順列検定」の逆説的な振る舞いに出会いました。その原型はフィッシャー検定です。ここにあります。 400人の個人の2つのグループ(例:対照400例と例400)があり、2つのモダリティ(例:曝露/非曝露)の共変量があるとします。露出した個人は5人だけで、すべて2番目のグループです。フィッシャーテストは次のようになります。 > x <- matrix( c(400, 395, 0, 5) , ncol = 2) > x [,1] [,2] [1,] 400 0 [2,] 395 5 > fisher.test(x) Fisher's Exact Test for Count Data data: x p-value = 0.06172 (...) しかし今、2番目のグループ(症例)には、疾患の形態や求人センターなど、いくつかの不均一性があります。それは100人の4グループに分けることができます。このようなことが起こりそうです: > x <- matrix( c(400, 99, 99 , 99, 98, 0, …

1
順列検定:検定統計量を選択する基準
私は定期的に順列テストを使用しており、その単純さが大好きです。私は、グッドによる本「リサンプリング手法」から最も多くを学びました。著者は、例全体を通してテスト統計の選択において非常に創造的であるようです。また、この投稿は、検定統計量を選択する大きな自由があるという印象を与えます。 テスト統計が従うべき理論的要件があるかどうかはわかりません。それとも、直観的に意味があり、タイプI / IIエラー率が高い限り、任意の統計を使用できますか? たとえば、非正規母集団のためにt検定の代わりに置換検定が使用される場合、置換検定のp値が依然としてt統計から得られることが何度かありました。必ずしも間違っているわけではありませんが、スチューデントt分布の起源を考えると、奇妙な選択のようです。

1
特徴選択のためのランダム置換テスト
ロジスティック回帰のコンテキストでの特徴選択のための順列分析について混乱しています。 ランダム置換テストの明確な説明と、それが特徴選択にどのように適用されるかを教えてください。おそらく正確なアルゴリズムと例で。 最後に、LassoやLARなどの他の収縮方法と比較してどうですか?

2
プロポーションのコンテキストで多重比較の問題を回避するために順列検定を使用できますか?
特定のバイナリの結果を予測するための5つの異なる方法の有効性を評価しています(「成功」と「失敗」と呼びます)。データは次のようになります。 Method Sample_Size Success Percent_Success 1 28 4 0.14 2 19 4 0.21 3 24 7 0.29 4 21 13 0.61 5 22 9 0.40 これら5つの方法の中で相対的な優位性を評価するためのテストを行いたいと思います。つまり、メソッドをパフォーマンスの順にメソッド1>メソッド2> ...メソッド5の順に並べたいのです。複数の比較の問題を回避するために、次のように順列テストを実行する予定です。 ステップ1:すべてのデータをプールして、全体のサンプルサイズが114になり、全体で37の成功を収めます。 ステップ2:データをランダムに5つのグループに分割し、対応するサンプルサイズを28、19、24、21、22にします。 手順3:手順2で観察されたPercent_Successの順序がデータの順序と一致している場合は、カウンターを増分します。 手順4:手順2と3を何度も繰り返します(たとえば10000)。 望ましいp値=最終カウンター値/ 10000。 質問: 上記の手順は大丈夫ですか? 上記のテストを実行できるようにするRの要素はありますか? 改善や代替方法の提案があれば役に立ちます。

3
順列検定のパラメーターの信頼区間をどのように作成しますか?
順列検定は、元のデータからランダムに抽出された順列リサンプルに基づく有意性検定です。置換で描画されるブートストラップサンプルとは対照的に、置換リサンプルは置換なしで描画されます。ここで私はRで行った例、単純な並べ替え検定のは。(あなたのコメントは大歓迎です) 順列テストには大きな利点があります。正規性などの特定の母集団の形状は必要ありません。これらは、帰無仮説の下で単純な分布を持つ統計だけでなく、さまざまな統計に適用されます。母集団の形状とサイズに関係なく、非常に正確なp値を提供できます(十分な順列が使用されている場合)。 また、テストと共に信頼区間を与えることがしばしば役立つことも読んだ。これは、順列再サンプリングではなくブートストラップ再サンプリングを使用して作成される。 信頼区間がどのように構成されているか(つまり、上記の例の2つのサンプルの平均値の差について)説明できますか(または、Rコードを指定してください)? 編集 グーグルで調べた後、この興味深い読み物を見つけました。

1
ビーガンのアドニス:変数の順序または階層の使用
パッケージadonis()内の関数を使用して、vegan1)共生する宿主種が複数のサイト間で微生物群集で異なるかどうか、および2)サイトが異なるかどうかを決定しています。CVとSOに関するすべての投稿を調べましたが、アドニス機能を使用して複数の要因の重要性を判断する方法に対する明確な答えはありません。 /programming/26768779/vegan-adonis-unbalanced-design-ss-type-ii-or-iiiで提案されているように、私は最初にこれを行いました: ここで、jaccはジャカードメトリックを使用した非類似度行列です adonis <- adonis(jacc ~ Species + Site, data = df_compare) adonis Call: adonis(formula = jacc ~ Species + Site, data = df_compare) Permutation: free Number of permutations: 999 Terms added sequentially (first to last) Df SumsOfSqs MeanSqs F.Model R2 Pr(>F) Species 2 0.6055 0.30273 1.7690 0.04981 0.004 …

2
R内のペアのベクトルのランダム化/置換テスト
私は専門家ではないので、用語が少し不器用な場合はご容赦ください。必要に応じて詳細情報を提供させていただきます。 Rに50のペア数値の2つのベクトルがあります。両側のランダム化または置換テストを実行して、それらの違いが偶然によるものかどうかを判断します。 順列検定(ランダム化検定、再ランダム化検定、正確検定とも呼ばれます)は、帰無仮説のもとでの検定統計量の分布が検定統計量のすべての可能な値を計算することによって得られる一種の統計的有意性検定です観測されたデータポイントのラベルの再配置の下。 ベクトルの値の分布がt検定などの他の検定(たとえば、ベクトルの数値の多くが0である)の仮定に違反していると思うので、このタイプの検定を実行します。 BHH2ライブラリのpermtest関数は、ほとんど私がやりたいことを実行しますが、2 50のすべての順列に対して機能します。代わりに、多数の可能な順列をサンプリングして、p値を推定します。私はcoinパッケージを調べましたが、ペアになっている数値ベクトルからのサンプリングを使用した置換テストを実行しているようには見えません。2502502^{50} 一部のグーグルでこのメールが表示されます。これは、パッケージを見つけることができない理由は、それがRのワンライナーであることを示唆しています。残念ながら、Rでこれを作成するのに十分な経験がありません-ライナー。 置換空間のサンプルのみを使用して両側ペア置換テストを実行するパッケージまたはメソッドはありますか? そうでない場合、誰かがそれを行うための短いRコードを共有できるでしょうか?

2
「再編成トリック」の名前(データセットをランダムに並べ替えて、推定器のバイアスを推定します)
複雑なモデリング手法が偏っているかどうかを調べるための次の方法の参照または名前を知っていますか?TTT 元のデータセットにを適用します。そのパフォーマンスを測定します(例:回帰設定のR-2乗)。TTT 応答変数をランダムに並べ替えて、新しいデータセットを取得します。を適用し、そのパフォーマンスを測定します。[観測が依存している場合、このステップはより複雑になります。]P 'TTTP』P′P' が実質的にゼロのパフォーマンスと異なる場合、がバイアスされていると結論付けます。 TP』P′P'TTT リソースが許す場合、ステップ2を繰り返すことができます。これにより、パフォーマンス測定の順列ヌル分布が発生します。しかし、私のアプリケーションでは、リソースの問題のためにこれを行うことはできません。 この「再編成」のトリックは、誰かが(一部の設定で)リーブワンアウト相互検証のバイアスを調査するために使用したことを暗に覚えています。しかし、彼が私のプロセスの中で一度だけプロセス全体を繰り返すことができたのかどうかはわかりません。 単純な後方選択の「力」を示すRの例: # Generate random data set. Only random performance is expected. n <- 100 p <- 30 set.seed(7567) y <- rnorm(n) X <- rnorm(n*p) dim(X) <- c(n, p) data <- data.frame(y, X) # Modelling technique: backward selection with OLS T <- function(data) …

2
ウィルコクソンの順位和検定は、寄付の合計が異なるかどうかを確認する正しい検定ですか?
バックグラウンド: 私のソフトウェアは、ユーザーに任意の金額の寄付を求めています。ユーザーにテスト寄付のリクエストを分割して、尋ねる最良の方法を見つけました:50%がリクエストバージョン1を取得し、50%がリクエストバージョン2を取得し、どちらがより良いかを確認します。 ほとんどすべてのユーザーが0ドルを寄付しますが、一部は寄付します。結果は次のようになります。 Number of users Number of donations Dollar amounts donated GROUP A 10,000 10 40,20,20,20,15,10,10,5,5,5 GROUP B 10,000 15 50,20,10,10,10,10,10,10,5,5,5,5,5,5,5 1つのグループが勝者であるか、それとも同点であるか、または確実にするためにより大きなサンプルが必要かどうかを知りたい。(この例は、議論を簡単にするために残されていますが、重要な結果を得るためには、ほぼ確実に大きなサンプルが必要です。) 私がすでに測定しているもの: 1つのグループで寄付の数が大幅に増えましたか?どれくらい大きい? 私はこのp値と信頼区間をABBA Thumbtackツールを使用して測定し、寄付の数とユーザーの数のみを使用して、金額は無視しています。その方法論については、「基礎となる統計とは」に説明されています。そのリンクのセクション。(それは私の頭の上にありますが、寄付率の差をアグレスティクーリ間隔の通常の確率変数としてとることによって信頼区間を計算すると思います。) 1つのグループが寄付した金額は大きく異なりますか? 順列テストを実行してこのp値を測定します。すべての2N被験者を2つのN被験者グループに繰り返しシャッフルし、グループ間の合計金額の差を毎回測定し、差が> =観察されたシャッフルの割合を見つけます。差。(これは、ドルの代わりにクラッカーに対して同じことを行うこのカーンアカデミーのビデオに基づいて有効だと思います。) Rのwilcox.test: wilcox.test()R についてのいくつかの質問: wilcox.test(paired=FALSE)上記のデータの表を入力した場合、上記のツールでまだ回答されていない新しい質問に答えて、テストの実行を継続するか、勝者を宣言するか、ネクタイを宣言するかを判断するためのより多くの洞察を与えますか? もしそうなら、それはどんな正確な質問に答えますか?

2
t検定(または順列検定)では、標本サイズの大きな違いと分散の違いが重要ですか?
私の頭の中では非常に混乱する質問があります。データがあり、男性と女性の数値スコアを比較したい。 これらの2つのグループには大きな違いがあります。男性の数は34で、女性の数は310で、分散は等しくありません。 私の知る限り、分散が等しくない場合は、ウェルチ・サッタースウェイト方程式を使用できます(分散が等しくないと仮定した独立t検定)。私の質問は、2つのサンプル間でサンプルサイズに本当に大きな違いがあるにもかかわらず、この方程式を使用できますか?または、2つのサンプル間のサンプルサイズの違いに特定の制限はありますか?

1
順列ベースのp値に必要な順列の数
有意水準順列ベースの値を計算する必要がある場合pppαα\alpha、いくつの順列が必要ですか? 5ページの記事「分類子のパフォーマンスを研究するための順列テスト」から: 実際には、上限は通常、テストの望ましい精度を達成するために必要なサンプル数を決定するために使用されます。1/(2k−−√)1/(2k)1/(2\sqrt{k}) ...ここで、は順列の数です。kkk この式から必要な順列の数を計算するにはどうすればよいですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.