タグ付けされた質問 「fishers-exact」

分割表の仮説検定。

1
フィッシャーの正確確率検定(順列検定)の意外な動作
いわゆる「厳密検定」または「順列検定」の逆説的な振る舞いに出会いました。その原型はフィッシャー検定です。ここにあります。 400人の個人の2つのグループ(例:対照400例と例400)があり、2つのモダリティ(例:曝露/非曝露)の共変量があるとします。露出した個人は5人だけで、すべて2番目のグループです。フィッシャーテストは次のようになります。 > x <- matrix( c(400, 395, 0, 5) , ncol = 2) > x [,1] [,2] [1,] 400 0 [2,] 395 5 > fisher.test(x) Fisher's Exact Test for Count Data data: x p-value = 0.06172 (...) しかし今、2番目のグループ(症例)には、疾患の形態や求人センターなど、いくつかの不均一性があります。それは100人の4グループに分けることができます。このようなことが起こりそうです: > x <- matrix( c(400, 99, 99 , 99, 98, 0, …

2
お茶を味わう女性の力
有名なフィッシャーの実験では、観測可能なのは、2種類のカップAとBを持つ修正された推測カップ数です。通常、テストαのサイズを前提として、臨界領域を計算して帰無仮説(女性がランダムに推測している)を拒否することは興味深いことです。これは、超幾何分布を使用して簡単に実行できます。同じ方法で、クリティカル領域を指定してテストのサイズを計算できます。kkkAAABBBαα\alpha 別の質問は、対立仮説が与えられた場合の検定の検出力の計算方法ですか?たとえば、女性がシングルカップの確率で正しく推測できると仮定します(P (guess A | true A )= P (guess B | true B )= 0.9)。N = 8に等しいカップの総数と1種類のカップの総数n = N / 2 = 4と仮定して、テストの力は何ですかp=90%p=90%p=90\%P(guessA|trueA)=P(guess B|true B)=0.9P(guessA|trueA)=P(guess B|true B)=0.9P(\text{guess} A|\text{true} A)=P(\text{guess } B|\text{true } B)=0.9N=8N=8N=8n=N/2=4n=N/2=4n=N/2=4?(残念ながら)女性は知っています。nnn 言い換えれば、女性が1種類のカップがn個あることを知っている場合、(対立仮説での正しいカップの数)の分布は何ですか?k=k=k=nnn


4
対応のあるデータに対するフィッシャーの正確検定
肺がんのケースと一致したコントロール(肺がんなし)を考えます(年齢、性別などに基づく一致)。肺がんに対する喫煙の影響の証拠を見つけるために、分割表でフィッシャーの正確確率検定を使用しました。ただし、これは、コントロールとケースが一致したことを考慮していません。 40404040404040 それで、2つのグループ間の一致を考慮に入れるフィッシャーの正確検定を使用する方法があるかどうか疑問に思いましたか?

3
フィッシャーの直接確率検定の検定統計量とは何ですか?
2×2分割表のために、一部が前記フィッシャーの正確確率検定をカウント使用検定統計量としてテーブルに(1,1)セルで、ヌル仮説の下で、X 1 、1は超幾何分布を有することになります。X1,1X1,1X_{1,1}X1,1X1,1X_{1,1} 一部の人は、そのテスト統計は次のとおりだと述べました ここで、μはnullでの超幾何分布(上記)の平均です。また、p値は超幾何分布の表に基づいて決定されるとも述べています。平均を差し引いて絶対値を取る理由があるのだろうか?| X 1 、1 - μ | nullの下に超幾何分布はありませんか?|X1,1−μ||X1,1−μ| |X_{1,1} - \mu| μμ\mu|X1,1−μ||X1,1−μ||X_{1,1} - \mu|

3
分布を見つけて正規分布に変換する
1時間にイベントが発生する頻度(「1時間あたりの数」、nph)とイベントが持続する時間(「1秒あたりの秒数」、dph)を説明するデータがあります。 これは元のデータです: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, NA, 6.00000000004109, 9.71428571436649, 12.4848484848485, 16.5034965037115, 20.6666666666667, 3.49999999997453, 4.65882352938624, 4.74999999996544, 3.99999999994522, 2.8, 14.2285714286188, 11.0000000000915, NA, 2.66666666666667, 3.76470588230138, 4.70588235287673, 13.2727272728677, 2.0000000000137, 18.4444444444444, 17.5555555555556, 14.2222222222222, 2.00000000001663, 4, 8.46153846146269, 19.2000000001788, 13.9024390245481, 13, 3.00000000004366, NA, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

2
2x2分割表のテスト:男性/女性、雇用/非雇用
私は科学を専攻していて、私の統計学の知識は表面的なものです。 問題 データセットを見つけ、統計コースの課題として自分の能力を最大限に活用して分析する必要がありました。これはもはや課題ではありません。分析がうまくいかなかった理由と代わりに何をすべきかを解釈するのに助けが必要です。 私はニュージーランドの雇用率のカテゴリーデータセットを使用して、2x2分割表に配置し、ピアソンのカイ2乗検定とフィッシャーの正確確率検定を使用して、性別が雇用と相関しているかどうかを検定しました。 答えたいこと この問題に対してカイ2乗検定とフィッシャーの正確確率検定を使用できない理由を理解し、代わりに何を使用すべきかを理解してください。「時間の関数としてのオッズ比」と思いますか?Rで完全にそれを行う方法に関する有用なリンクはありますか? 割り当ての最初の部分に関する「順次相関」コメントと、正確に何をすべきかを理解してください。 私を助ける方法#1(短い) データは次のとおりです(国勢調査に基づく)。 Male Female Employed 1201600 1060200 Unemployed 73300 75000 Rでカイ2乗検定とフィッシャーの正確確率検定を行いました。得られたp値から、nullがtrue(男性と女性)である場合に、このような仕事の分布(または1つ以上の極値)の確率がわかると想定しています。就職のチャンスは同じです)。私は非常に小さいp値を取得しました。フィッシャーのテストでは、オッズ比1.16が得られました。これは、相関関係があり、特に男性がニュージーランドで就職する可能性が16%高いことを意味します。 しかし、私の講師によると、私はこれらのテストを不適切に使用しました。理由はよくわかりませんでしたが、これらのテストは独立性を前提としていると彼は言っていたと思います。NZには一定量の求人があるため、サンプルは独立していないので...下に引用されている彼のフィードバックを見ることができます)。 私を助ける方法#2(長い) 時間に余裕があれば、課題全体をご覧いただければ幸いです。講師からのフィードバックも添えてお伝えしますので、よろしくお願いします!割り当ては数学者/統計学者にとって非常に簡単であり、そこには2つの質問しかありません。私がやっていることを知っていることを実証しようとしたところ、パディングでいっぱいになりました。ほとんどはスキップできます。 これが、私が成功しなかった割り当てを含むPDFファイルへのリンクです。statisticsassignment.pdf。 講師のフィードバック 図1は逐次相関を示しています。これが線形回帰が機能しない本当の理由です。フィッシャーのテストもカイ二乗も、2x2テーブルには適していません。これは、均一性をテストしたいが、独立性がないためnullを拒否しているためです(これは興味深いことではありません)。この2つの違いはここでは関係ありません(どちらの場合も漸近的に同一です)。時間の関数としてオッズ比をプロットすることもできます。

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

1
フィッシャーの正確確率検定の不適切な使用を回避する時期と方法
Richard McElreathがフィッシャーの正確な検定が彼の優れたベイジアン紹介本(統計的再考)でますか? 参考までに、コンテキストは以下のとおりです。 なぜ革新的な研究に十分なテストではないのですか?導入統計の古典的な手順は、柔軟性がなく、壊れやすい傾向があります。柔軟性がないということは、彼らが独自の研究状況に適応する方法が非常に限られているということです。壊れやすいということは、新しいコンテキストに適用すると、予測できない方法で失敗するということです。ほとんどの科学の境界では、どの手順が適切であるかがはっきりしないので、これは重要です。従来のゴーレムはどれも斬新な研究環境で評価されていないため、1つを選択してそれがどのように動作するかを理解するのは難しい場合があります。良い例はフィッシャーの正確検定です。これは非常に狭い経験的コンテキストに(正確に)適用されますが、セル数が少ない場合は常に使用されます。私は個人的にフィッシャーの正確な検定の数百の使用法を科学雑誌で読みましたが、フィッシャーの元の使用法は別として、それが適切に使用されたことはありません。多くの点で非常に柔軟性があり、興味深い多様な仮説を非常に多様にエンコードできる通常の線形回帰のような手順でさえ、壊れやすい場合があります。たとえば、予測変数に大きな測定誤差がある場合、手順は見事に失敗する可能性があります。しかし、より重要なことに、主にオーバーフィッティングと呼ばれる現象が原因で、通常の線形回帰よりも優れた処理を行うことがほぼ常に可能です。

1
傾向スコアと一致するデータのマクネマーまたはフィッシャーの正確検定?
傾向スコアの一致したデータを分析したい。文献では、データが「ペアになっている」ため、マクネマー検定が通常使用されます。ただし、マッチングは常識ではペアリングではありません。 フィッシャーの正確確率検定を使用する方が正しいでしょうか?一致したデータに対応のあるテストを使用することについて、どのような意見がありますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.