帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?


15

順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。

この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。

注:
置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。

更新:
私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35
。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき
ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する
ますか?-機能Aの対象とV2の機能Bの対象を比較しますか?
-V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか?
-この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
ルーズリーフ紙の別のシートで各観察を行い、スタックを渡すと、私は滑って、シートが床に落ち着くとすべての方向に飛び出しました。これらのデータに対して実行することを望んでいたテストの有効性が破壊された場合、それは残念です。あなたの観察結果が交換可能であり、それに基づいてテストを適用している場合、あなたは私を慰め、床から紙を集めるのを助けながら心配しないように私に言うでしょう。そうでなく、データ収集が特に高価だった場合、一生実行する必要があります。
枢機

2
一方、時系列データ(一般)などの場合順序重要であり、テストでは一般に適切な方法でこの順序を尊重する必要があります。
枢機

@cardinal、あなたの直感的な物語はこの仮定がどのように見えるかの鮮明な絵を描きましたが、落ちた貴重な論文が交換可能であったかどうかを判断する方法として私はまだ混乱しています。可能な場合は、別のコメントを求めることもできます!
博士号

回答:


7

fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1)など)。これが当てはまらない場合、順列を数えることは帰無仮説をテストする有効な方法ではありません。各順列は異なる重み(確率/密度)を持つためです。順列テストは、同じ密度/確率を持つ変数への特定の数値セットの各割り当てに依存します。

f(x1=1,x2=2,X3=3...XN=N)f(x1=N,x2=N1,X3=N2...XN=1)


+1。交換可能性については十分に説明されていますが、手元の研究にジャーのメタファーを適用しようとしてつまずきました。(質問の更新を参照してください)。訪問の期間と、機能に基づいたサブグループ化を考えると、これらの値の比較が交換可能かどうかをどのように判断できますか?
博士号

@doctorate:Par1の結果に関連する要因でグループを階層化しているようですね。特定のA / Bフィーチャ象限内で順列を使用している限り、対象は交換可能であると想定します。機能を横断する最初のテストは、交換可能性に依存するテストを使用する前に、さらに処理する必要があります。特に、治療の効果を定量化し、機能AとBの交絡効果を修正する必要があります。そうしないと、山のサイズが全体的な結果に影響します(シンプソンのパラドックス)

1
@doctorate:私の上記のコメントは、あなたが望むものに対して斜めのようなものである可能性があることに気付きました:あなたの場合のjarファイルは、機能のペア、つまり(A +、B +)、(A-、B +)、(A +、B -)、(B-、A-)合計4つの「jar」。それはより具体的にするのに役立ちますか?

Tks、しかし私のような非統計学者を混乱させるのは、この仮定が満たされたかどうかをどのように判断できるかということです。多くの場合、仮定を調べるためのテストがあります。たとえば、正常性については、シャピロウィルクテストがあります。しかし、どのテストが交換可能性を調べるのだろうか?さもなければ、それは非常に難しいかあいまいな定義になり、2人の統計学者はこれまたはそのサブグループに同意しないかもしれません。あなたが述べたように、A / B象限内では問題はありませんが、薬物/プラセボ内では懸念を示しました。それで、この仮定のための酸テストはありますか?
博士号

2
交換可能性に関しては、交換可能性の「テスト」はありません。独立性(テスト可能)とは異なり、交換可能性はモデリングの前提であり、採取したサンプルのように繰り返しサンプルを採取し場合、各置換はまったく同じ時間に発生することがわかります。サンプルは1つしかないため、「テスト」することはできません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.