タグ付けされた質問 「wilcoxon-mann-whitney」

ウィルコクソン順位和検定は、マンホイットニーU検定とも呼ばれ、2つのサンプルの一方が他方よりも大きいかどうかを評価するノンパラメトリックランク検定です。

4
マンホイットニー検定をクラスカル・ウォリス後の事後比較に使用できますか?
動物が敵対的な環境に置かれ、生存のためのいくつかのアプローチを使用してどのくらいの期間生き残ることができるかをシミュレーションするシミュレーションがあります。それが生き残るために使用できる3つのアプローチがあります。私は、各生存アプローチを使用して、動物のシミュレーションを300回実行しました。すべてのシミュレーションは同じ環境で行われますが、ランダム性があるため、毎回異なります。各シミュレーションで動物が生存する秒数を計測します。長生きすることは良いことです。私のデータは次のようになります: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these この時点以降に何をするかわからないので、私が愚かで間違っていることをしているのかどうかを知らせてください。特定のアプローチを使用して、寿命に統計的な違いがあるかどうかを調べようとしています。 各サンプルに対してShapiroテストを実行したところ、小さなp値が返されたため、データが正規化されていないと思います。 行のデータは互いに関係がありません。各シミュレーションに使用されるランダムシードは異なりました。その結果、データがペアになっていないと思います。 データが正規化されておらず、ペアになっておらず、サンプルが3つ以上あるため、クラスカルウォリス検定を実行しました。p値は0.048でした。次に、ポストホックに移り、Mann Whitneyを選択しました。マンホイットニーをここで使用する必要があるかどうかは本当にわかりません。 マンホイットニー検定、つまり{(アプローチ1、アプローチ2)、(アプローチ1、アプローチ3)、(アプローチ2、アプローチ3)}を実行して、各生存アプローチを互いに比較しました。両側検定を使用してペア(アプローチ2、アプローチ3)の間に統計的有意性の所見はありませんでしたが、片側検定を使用して有意差が見つかりました。 問題: このようにマンホイットニーを使用することが理にかなっているかどうかはわかりません。 私は片側または両側のマンホイットニーを使用する必要があるかどうかわかりません。

2
不等分散の下でのマンホイットニー帰無仮説
マンホイットニーのU検定の帰無仮説に興味があります。私はしばしば、帰無仮説が2つの母集団の分布が等しいという仮説であると述べたのを見ます。しかし、私は考えています。平均が同じで分散が非常に異なる2つの正常な母集団がある場合、マンホイットニー検定はおそらくこの違いを検出しません。 また、マンホイットニー検定の帰無仮説がまたは2番目の母集団からの観測()を超える1つの母集団からの観測()の確率()(タイの除外)は0.5です。これはもう少し理にかなっているようですが、私が述べた最初の帰無仮説と同等ではないようです。Pr(X>Y)=0.5Pr(X>Y)=0.5\Pr(X>Y)=0.5XXXYYY 私はこれを解くのに少し助けが欲しいと思っています。ありがとう!

1
Rの数式インターフェイスを使用しているときにMan-Whitney Uを解釈するにはどうすればよいですか
次のデータがあるとします。 set.seed(123) data <- data.frame(x = c(rnorm(50, 1, 1), rnorm(50, 5, 2)), y = c(rep('A', 50), rep('B', 50))) 次の箱ひげ図(boxplot(data$x ~ data$y))が得られます。 ここで、2つのサンプルが同じ位置パラメーター(中央値または平均値、あるいはその両方)を持っているかどうかをテストしたいとします。私の実際のケースでは、データが明らかに正常ではないため、次のようにWilcoxon-Mann-Whitney検定を実行することにしました。 wilcox.test(data$x ~ data$y) しかし、私は対立仮説として、B data$yの「第2」の因子は、より高い位置パラメーターを持つ分布に由来するということを望みます。alternativeパラメータを「大きい」と「小さい」に設定しようとしましたが、どうやら対立仮説は私が探しているものではありません。たとえば、alternative = "greater"「代替仮説:真の位置シフトは0よりも大きい; alternative = "less"「代替仮説:真の位置シフトは0未満です。」 必要な対立wilcox.test()仮説(BはAよりも高い位置パラメーターを持つ分布から得られる)を得るために、関数をどのように調整できますか?または、代わりに別のテストを使用する必要がありますか?


1
コルモゴロフスミルノフZ対マンホイットニーU小サンプルサイズn = 15?
サンプルサイズが15と小さいです。2つの独立変数、グループ1 n = 11、グループ2 n = 4の間で栄養素摂取量に違いがあるかどうかを確認したいと思います。データは正規分布していません。Mann Whitney UとKolmogorov-Smirnov Zのどちらのテストがより適切ですか?Andy FieldのSPSSを使用したDiscovering Statisticsは、KS Zは小さなサンプルサイズに使用する必要があると述べています。 Kolmogorov-Smirnov Z:第5章では、サンプルが正規分布母集団からのものであるかどうかをテストするKolmogorov–Smirnovテストに出会いました。これは別のテストです!実際、2つのグループが同じ母集団から引き出されているかどうかをテストします(その母集団が何であるかに関係なく)。つまり、これはマンホイットニー検定とほぼ同じことを意味します。ただし、このテストは、サンプルサイズがグループあたり約25未満の場合、マンホイットニー検定よりも優れたパワーを持つ傾向があるため、そうである場合は選択する価値があります。 また、p値とともに摂取量を報告する場合、データはノンパラメトリックなので、平均値と標準偏差または中央値とIQRを使用する必要がありますか? 何かアドバイスをいただければ幸いです。

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
ウィルコクソンの代わりにランクとz変換?
Andrew Gelmanは彼のブログの最近の投稿で、ランクを使用し、ランクをZスコアに変換してから、ノンパラメトリックテストを実行する代わりに、パラメトリックテストとツールを使用することを提案しています。今まで聞いたことがありません。 Googleでの検索により、パッケージGenABELのこのR関数が示されました。これは、データベクトルのランク+ z変換を実行しているようですが、代わりに変換されたデータでパラメトリックテストを使用するアイデアを評価または議論する論文を見つけることができませんでした。ウィルコクソンテストの。 誰かがこの方法に関するいくつかの文献を私に指摘できますか?

2
ウィルコクソンの順位和検定は、寄付の合計が異なるかどうかを確認する正しい検定ですか?
バックグラウンド: 私のソフトウェアは、ユーザーに任意の金額の寄付を求めています。ユーザーにテスト寄付のリクエストを分割して、尋ねる最良の方法を見つけました:50%がリクエストバージョン1を取得し、50%がリクエストバージョン2を取得し、どちらがより良いかを確認します。 ほとんどすべてのユーザーが0ドルを寄付しますが、一部は寄付します。結果は次のようになります。 Number of users Number of donations Dollar amounts donated GROUP A 10,000 10 40,20,20,20,15,10,10,5,5,5 GROUP B 10,000 15 50,20,10,10,10,10,10,10,5,5,5,5,5,5,5 1つのグループが勝者であるか、それとも同点であるか、または確実にするためにより大きなサンプルが必要かどうかを知りたい。(この例は、議論を簡単にするために残されていますが、重要な結果を得るためには、ほぼ確実に大きなサンプルが必要です。) 私がすでに測定しているもの: 1つのグループで寄付の数が大幅に増えましたか?どれくらい大きい? 私はこのp値と信頼区間をABBA Thumbtackツールを使用して測定し、寄付の数とユーザーの数のみを使用して、金額は無視しています。その方法論については、「基礎となる統計とは」に説明されています。そのリンクのセクション。(それは私の頭の上にありますが、寄付率の差をアグレスティクーリ間隔の通常の確率変数としてとることによって信頼区間を計算すると思います。) 1つのグループが寄付した金額は大きく異なりますか? 順列テストを実行してこのp値を測定します。すべての2N被験者を2つのN被験者グループに繰り返しシャッフルし、グループ間の合計金額の差を毎回測定し、差が> =観察されたシャッフルの割合を見つけます。差。(これは、ドルの代わりにクラッカーに対して同じことを行うこのカーンアカデミーのビデオに基づいて有効だと思います。) Rのwilcox.test: wilcox.test()R についてのいくつかの質問: wilcox.test(paired=FALSE)上記のデータの表を入力した場合、上記のツールでまだ回答されていない新しい質問に答えて、テストの実行を継続するか、勝者を宣言するか、ネクタイを宣言するかを判断するためのより多くの洞察を与えますか? もしそうなら、それはどんな正確な質問に答えますか?

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

4
ロジスティック回帰とマンホイットニー/ t検定の選択
私は、先験的に決定された0と1の比率を持たない二分変数と、連続変数持っています。ああAbbb シナリオ1では、Iが指定する決めるとして独立変数、およびのように従属 変数。次に、マンホイットニー(分布なし)、t検定(正規分布)などの検定を使用して、をに対して検定します。ああAバツバツXbbbyyyバツバツXyyy シナリオ2では、私が指定することを決定したように従属変数、及びなどの独立 変数。次に、ロジスティック回帰を使用してをに対してテストします。ああAYYYbbbx YバツバツxバツバツxYYY と関係の方向性がわからない場合、つまりが独立変数であるかが独立変数であるかを判断できない場合、どのモデルを選択する必要がありますか?b A bああAbbbああAbbb 従属変数と独立変数のどちらがわからない場合、最初のインスタンスでt検定/マンホイットニーを一種の単変量分析として使用し、ロジスティック回帰を多変量分析として使用することは無効ですか?

2
Rのウィルコクソン順位和検定の効果サイズを決定する方法は?
2つのグループ間で平均p値に差があるかどうかを確認したいと思います。これを行うために、ウィルコクソンの順位和検定を実行します(データは通常は分散されません)。ここまでは順調ですね。最後に、対応するエフェクトサイズを計算します。残念ながら、Rはこれを提供していません。また、次を使用して効果サイズを簡単に計算できるz値も提供しません。効果サイズ= z / sqrt(N) ここにいくつかのサンプルRコードがあります: a=rep(0:1,each=20) #grouping variable b=c(rnorm(20, .03,.01), rnorm(20, .02, .009)) #vector of p-values d=cbind(a,b) test = wilcox.test(b ~ a, data = d) #perform Wilcoxon rank-sum test test 誰かがエフェクトサイズを取得する方法を知っていますか?

1
ウィルコクソン順位和検定の実行中に変数を制御するにはどうすればよいですか?
ウィルコクソン順位和検定を行って、2つのグループの変数分布に違いがあるかどうかを調べました。テスト結果は、違いが存在することを示しました。X1X1X_1 しかし、この違いを引き起こしている交絡変数があるのではないかと思います。X2X2X_2 をどのように制御できますか?X2X2X_2 シナリオ例: ジョーは、男性と女性のリスニング能力に違いがあるかどうかを知りたいと考えています。ジョーは、「年齢」は彼の研究において交絡変数である可能性があると考えています。彼は「年齢」をコントロールしたいと思っています。ジョーが実行できるノンパラメトリックテストはありますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.