タグ付けされた質問 「ties」

4
生存分析:連続時間と離散時間
生存分析で時間を連続的または離散的に扱うかどうかを決定する方法について混乱しています。具体的には、サバイバル分析を使用して、男の子と女の子の生存率(5歳まで)に与える影響に最大の不一致がある子供レベルと家庭レベルの変数を特定したいと思います。子供の年齢(月単位)のデータセットと、子供が生きているかどうか、死亡年齢(月単位)、およびその他の子供および世帯レベルの変数のインジケータがあります。 時間は月単位で記録され、すべての子供が5歳未満であるため、多くの拘束生存期間があります(多くの場合、半年間隔で0か月、6か月、12か月など)。私がサバイバル分析について読んだものに基づいて、サバイバルタイムが多数あることは、時間を離散として扱うべきだと思うようになります。しかし、私は、生存期間が例えば人年である(そして確実に生存期間が同じである)他のいくつかの研究を読み、コックス比例ハザードのような連続時間法が使用されています。 時間を連続または離散として扱うかどうかを判断するために使用する必要がある基準は何ですか?私のデータと質問については、連続時間モデル(Cox、Weibullなど)を使用することは直観的に理にかなっていますが、データの離散的な性質と関連する生存時間の量は別の方法を示唆しているようです。
20 survival  ties 

2
Rのコルモゴロフ-スミルノフ検定について
コルモゴロフ-スミルノフのテスト関数の出力を理解しようとしています(2つのサンプル、両面)。これは簡単なテストです。 x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x and y #D = 0.5, p-value = 0.1641 #alternative hypothesis: two-sided # #Warning message: #In ks.test(x, y) : cannot compute exact p-value with ties ks.test(x,z) #Two-sample Kolmogorov-Smirnov test #data: x and z …

1
修正されたタイデータのコルモゴロフスミルノフ検定に代わる方法はありますか?
2つのサンプル(コントロールと処理済み)から大量のデータを取得しました。各サンプルには、Rで有意性検定を受ける数千の値が含まれています。トンと彼らは関係を持っています。分布は不明であり、コントロールと処理された分布の形状は異なる可能性があります。そのため、ノンパラメトリック検定を使用して、サンプル全体の違いが10の異なる要因で有意であるかどうかを比較します。 コルモゴロフとスミルノフのテストを使用することを考えましたが、それは本当に関係に適していません。私は最近、KSテストのブートストラップバージョンを実行し、関係を許容するMatchingと呼ばれる新しいRライブラリを見つけました。これは本当に良いアイデアですか、代わりに別のテストを使用する必要がありますか?そして、p値を調整する必要がありますか?

1
ノンパラメトリック統計でなぜ同順位が難しいのですか?
私のノンパラメトリックテキストPractical Nonparametric Statisticsでは、期待値、分散、検定統計量などについて明確な式が示されることがよくありますが、これは関係を無視した場合にのみ機能するという警告が含まれています。Mann-Whitney U統計を計算するときは、どちらが大きいかを比較するときに、タイペアを捨てることをお勧めします。 どちらのグループも他のグループよりも大きいため、関係はどの人口が大きいかについてはあまり教えてくれません(それが私たちが興味を持っているのであれば)。しかし、漸近分布を開発する場合、それは問題ではないようです。 なぜそれはいくつかのノンパラメトリック手順での関係を扱うのにそんなに困惑しているのですか?単にそれらを捨てるのではなく、タイから有用な情報を抽出する方法はありますか? 編集:@whuberのコメントに関して、ソースを再度確認しました。一部の手順では、関連付けられた値を完全に削除するのではなく、ランクの平均を使用しています。これは、情報の保持に関しては賢明なことのように思えますが、厳密さを欠いているようにも思えます。しかし、疑問の精神は今でも残っています。

4
kNNでの関係、重み、および投票の処理
私はkNNアルゴリズムをプログラミングしていますが、次のことを知りたいです: タイブレーク: 多数決で明確な勝者がいない場合はどうなりますか?たとえば、k個のすべての最近傍が異なるクラスに属している、またはk = 4の場合、クラスAから2つの近傍とクラスBから2つの近傍がありますか? 同じ距離を持っているより多くの隣人があるために正確にk個の最も近い隣人を決定することが不可能な場合はどうなりますか?たとえば、距離のリストの(x1;2), (x2;3.5), (x3;4.8), (x4;4.8), (x5;4.8), (x6;9.2)場合、3番目から5番目の近傍はすべて同じ距離を持っているため、k = 3またはk = 4の近傍を決定することはできません。 重さ: 勝ったクラスを選択する前に、k最近傍に重みを付けるのが良いと読みました。それはどのように機能しますか?すなわち、隣人はどのように重み付けされ、クラスはどのように決定されますか? 多数決案: 多数決以外の勝ち組を決定する他のルール/戦略はありますか?

2
Rでの1標本Kolmgorov-Smirnov検定における「関係は存在すべきではない」
私はコルモゴロフ・スミルノフ検定を使用して、RでのMYDATAの正規性をテストします。これは私が行うことの例です ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA)) ここにRが私に与えた結果があります: data: MYDATA D = 0.13527, p-value = 0.1721 alternative hypothesis: two-sided Warning message: In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) : ties should not be present for the Kolmogorov-Smirnov test 問題があると思いますが、この警告の「関係」とはどういう意味ですか?

1
Kruskal-Wallis組み込みR関数と手動計算の間のわずかな不整合
私は次のことに戸惑い、答えを他の場所で掘り下げることができませんでした。 私はいくつかの統計を行いながらRを学習しようとしています。そして、演習として、組み込みのR関数の結果を、Rのように「手動」でも実行することによって、ダブルチェックしてみます。 、Kruskal-Wallis検定では、さまざまな結果が得られますが、その理由がわかりません。 たとえば、私は演習で配布された次のデータを見ています activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2) group <- c(rep("A", 11), rep("B", 10), rep("C", 9)) group <- factor(group) data.raw <- data.frame(activity, …

3
ウィルコクソン検定を実行する前にジッターすることは間違っていますか?
スクリプトをwilcox.test記述してを使用してデータをテストしましたが、結果が得られたとき、すべてのp値は1に等しくなりました。データをテストする前にジッターを使用できることをいくつかのWebサイトで読みました(前述の関係を避けるため)。私はこれをしました、そして今、私は許容できる結果を持っています。これを行うのは間違っていますか? test<- function(column,datacol){ library(ggplot2) t=read.table("data.txt", stringsAsFactors=FALSE) uni=unique(c(t$V9)) for (xp in uni) { for(yp in uni) { testx <- subset(t, V9==xp) testy <- subset(t, V9==yp) zz <- wilcox.test(testx[[datacol]],jitter(testy[[datacol]])) p.value <- zz$p.value } } } これはの出力です dput(head(t)) structure(list(V1 = c(0.268912, 0.314681, 0.347078, 0.286945, 0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006, 0.133417, …
9 r  nonparametric  ties 


1
クラスカル・ウォリスのポストホックの警告メッセージ「関係が存在します」を理解する
Kruskal-Wallis検定の後で事後比較を実行しています。PMCMRパッケージを使用しています。 > posthoc.kruskal.nemenyi.test( preference ~ instrument) Pairwise comparisons using Tukey and Kramer (Nemenyi) test with Tukey-Dist approximation for independent samples data: preference by instrument Cello Drums Guitar Drums 0.157 - - Guitar 0.400 0.953 - Harp 0.013 0.783 0.458 P value adjustment method: none Warning message: In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, …
8 r  ties 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.