タグ付けされた質問 「kruskal-wallis」

クラスカル・ウォリスの手順は、3つ以上のグループの位置を比較するために使用される一方向分散分析のノンパラメトリックなものです。これは、2つのサンプルのMann-Whitney-Wilcoxonプロシージャを拡張したものです。

5
機械学習で階層/ネストされたデータを処理する方法
例で問題を説明します。いくつかの属性(年齢、性別、国、地域、都市)を与えられた個人の収入を予測するとします。あなたはそのようなトレーニングデータセットを持っています train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
ANOVAとKruskal-Wallis検定の違い
私はRを学んでおり、分散分析を実験しています。私は両方を実行しています kruskal.test(depVar ~ indepVar, data=df) そして anova(lm(depVar ~ indepVar, data=dF)) これら2つのテストの間に実際的な違いはありますか?私の理解では、どちらも母集団が同じ平均を持っているという帰無仮説を評価するということです。


1
Kruskal-Wallisの後の事後検定:Dunnの検定またはBonferroniはMann-Whitneyの検定を修正しましたか?
非ガウス分布変数がいくつかあり、5つの異なるグループのこの変数の値に大きな違いがあるかどうかを確認する必要があります。 Kruskal-Wallis一元配置分散分析(重要な結果になった)を実行した後、どのグループが大幅に異なるかを確認する必要がありました。グループは一種のソートされているため(最初のグループの変数の値は、3番目のグループの変数の値よりも低いと想定される2番目のグループの変数の値よりも低いと想定されます。 on)私は4つのテストのみを実行しました: Group 1 vs Group 2 Group 2 vs Group 3 Group 3 vs Group 4 Group 4 vs Group 5 この分析は、2つの異なる方法で実行しました。私はダンの多重比較テストを使用することから始めましたが、重要なものは何もありませんでした。一方、Mann-Whitneyテストを使用し、Bonferroniを使用したテストの数(4)を修正すると、3つのテストが重要になります。 どういう意味ですか?どの結果を信頼すべきですか?


1
ダンのテストの結果の読み方
Dunnの テストの結果を読むにはどうすればよいですか?具体的には、以下の表の値は何を教えてくれますか? 4つのグループにノンパラメトリックデータがあり、最初にクラスカルワリス検定を行って、グループの分布が互いに異なり、集合データセットと異なることを確認しました。次に、ダンのテストを使用して、どのグループが互いに異なっており、どのグループが異なっていたかを確認しました。 library(dunn.test) dunn.test(data, g=area, kw=TRUE) Kruskal-Wallis rank sum test data: x and area Kruskal-Wallis chi-squared = 1730.4401, df = 3, p-value = 0 Comparison of x by area (No adjustment) Row Mean-| Col Mean | A B C ---------+--------------------------------- B | 20.62310 | 0.0000 | C | 26.66519 …

1
ノンパラメトリック検定での複数比較
ノンパラメトリックで12の処理があるデータセットを使用しています。クラスカル・ウォリス検定を実行して、有意な値を得ました。次に、多重比較手順を実行して、どの処理が大幅に異なるかを確認します。このトピックに関しては多くの情報がありますが、この問題に特に対処するものは何も見つかりませんでした。何か案は?? ppp

2
重要ではない結果を報告する必要がありますか?
私はクラスカルウォリス検定を実行しましたが、一部の質問ではp値は重要ではありません。これを有意であるのと同じ方法で報告し、df、検定統計量、p値を示しますか?したがって、このようなKruskal Wallis検定が実行されますが、結果は有意ではないことがわかりましたH(3)= 2.119、p> 0.05(または、ここに正確なp値(.548)を記載します)

4
クラスカル・ウォリスとマン・ホイットニーが矛盾する結果を返しているように思われる場合、どの結果を選択しますか?
値が10ポイントのリッカートアイテムへの応答である次のグループがあります。 g1 <- c(10,9,10,9,10,8,9) g2 <- c(4,9,4,9,8,8,8) g3 <- c(9,7,9,4,8,9,10) したがって、私はクラスカル・ウォリスを使用してグループ内の応答間の違いを判断し、結果は次のとおりでした。 Kruskal-Wallis chi-squared = 5.9554, df = 2, p-value = 0.05091 ただし、グループg1とグループg2の間で正確なマンホイットニー検定を実行すると、次のようになります。 Exact Wilcoxon Mann-Whitney Rank Sum Test (using coin::wilcox_test) Z = 2.3939, p-value = 0.02797 これは、alpha = 0.05で有意差を返します。 どのテストを選択する必要がありますか。その理由は何ですか。

1
Kruskal-Wallis組み込みR関数と手動計算の間のわずかな不整合
私は次のことに戸惑い、答えを他の場所で掘り下げることができませんでした。 私はいくつかの統計を行いながらRを学習しようとしています。そして、演習として、組み込みのR関数の結果を、Rのように「手動」でも実行することによって、ダブルチェックしてみます。 、Kruskal-Wallis検定では、さまざまな結果が得られますが、その理由がわかりません。 たとえば、私は演習で配布された次のデータを見ています activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2) group <- c(rep("A", 11), rep("B", 10), rep("C", 9)) group <- factor(group) data.raw <- data.frame(activity, …

4
マンホイットニー検定をクラスカル・ウォリス後の事後比較に使用できますか?
動物が敵対的な環境に置かれ、生存のためのいくつかのアプローチを使用してどのくらいの期間生き残ることができるかをシミュレーションするシミュレーションがあります。それが生き残るために使用できる3つのアプローチがあります。私は、各生存アプローチを使用して、動物のシミュレーションを300回実行しました。すべてのシミュレーションは同じ環境で行われますが、ランダム性があるため、毎回異なります。各シミュレーションで動物が生存する秒数を計測します。長生きすることは良いことです。私のデータは次のようになります: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these この時点以降に何をするかわからないので、私が愚かで間違っていることをしているのかどうかを知らせてください。特定のアプローチを使用して、寿命に統計的な違いがあるかどうかを調べようとしています。 各サンプルに対してShapiroテストを実行したところ、小さなp値が返されたため、データが正規化されていないと思います。 行のデータは互いに関係がありません。各シミュレーションに使用されるランダムシードは異なりました。その結果、データがペアになっていないと思います。 データが正規化されておらず、ペアになっておらず、サンプルが3つ以上あるため、クラスカルウォリス検定を実行しました。p値は0.048でした。次に、ポストホックに移り、Mann Whitneyを選択しました。マンホイットニーをここで使用する必要があるかどうかは本当にわかりません。 マンホイットニー検定、つまり{(アプローチ1、アプローチ2)、(アプローチ1、アプローチ3)、(アプローチ2、アプローチ3)}を実行して、各生存アプローチを互いに比較しました。両側検定を使用してペア(アプローチ2、アプローチ3)の間に統計的有意性の所見はありませんでしたが、片側検定を使用して有意差が見つかりました。 問題: このようにマンホイットニーを使用することが理にかなっているかどうかはわかりません。 私は片側または両側のマンホイットニーを使用する必要があるかどうかわかりません。

2
Benjamini-Hochberg依存関係の仮定は正当化されますか?
約50の異なる変数に関して3つの母集団間の有意差をテストするデータセットがあります。これは、一方でKruskal-Wallis検定を使用し、もう一方では、入れ子のGLMモデルフィット(独立変数としての人口の有無にかかわらず)の尤度比検定によって行います。 その結果、一方ではクラスカル・ウォリスの値のリストがあり、もう一方ではLRT比較からのカイ2乗のp値だと思います。pppppp > 50の異なるテストがあるため、いくつかの形式の複数のテスト修正を行う必要があります。Benjamini-HochbergFDRが最も賢明な選択のようです。 ただし、変数はおそらく独立しておらず、それらのいくつかの「氏族」が相関しています。問題はそれです:私の値の基礎となる統計のセットが、Benjamini-HochbergプロシージャがFDRに引き続きバインドされるために必要な正の依存性の要件を満たしているかどうかはどうすればわかりますか?ppp 2001年のBenjamini-Hochberg-Yekutieli論文では、PRDS条件は多変量正規分布とスチューデント化分布に当てはまると述べています。モデル比較のための尤度比検定のカイ二乗値はどうですか?クラスカル・ウォリス検定の値はどうなりますか?ppp 依存関係に何も仮定しないBenjamini-Hochberg-Yekutieliの最悪の場合のFDR補正を使用できますが、この場合は保守的すぎるため、いくつかの関連する信号を見落とす可能性があります。

2
グループ間の(いくつかの)分位Qの違いをテストしていますか?
3つのグループ(X)に分割されているいくつかのY変数について、グループを比較し、90%の変位値が3つのグループすべてで同じであるという仮説を立てます。どのようなテストを使用できますか? 私が考えることができる1つのオプションは、分位回帰を使用することですが、他の選択肢/アプローチはありますか? 中央値を比較したい場合は、クラスカルウォリス検定を使用できたと思います(ランクに基づいていますが、正しく覚えていれば、残差分布が対称である場合に同じ結果が得られます)。 ありがとう。


1
多くのグループとの複数の比較
複数の比較テストを使用することが私のデータに適しているかどうかを判断したいと思います。クラスカルウォリス検定を使用して、異なるグループ間で平均阻害に差があるかどうかを判断しました。分析の結果、有意差があることがわかりました。次に、多重比較手順(おそらく、サンプルサイズが異なるのでDunnのもの)を使用して、他のグループと異なるグループを確認します。171717 私は多くのグループ()を持っているので、これは多重比較テストの能力がほとんどないか、このデータセットに対して実行するのに適切ではないのかと思っていました。k = 17k=17k = 17
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.