2
Rを使用して遺伝子リストの重複に複数のテスト補正を適用する方法
同じ薬剤に対する患者の反応を調べた2つの研究があります。研究1では、バックグラウンドを超えて発現する10,000の遺伝子が見つかり、そのうちの500の遺伝子は異なって発現され、薬物応答シグネチャと呼ばれています。研究2では、薬物応答の特徴を表す1,000の遺伝子が見つかりました。2つの署名の重複は100遺伝子です。 署名間のオーバーラップの統計的有意性を計算したい。私が正しく理解している場合、それを行う1つの方法(ここの投稿に基づく:RNA seqとChLPチップデータセットの間の遺伝子リスト重複の確率の計算およびここ:リストの重複確率を取得するためのRのphyperの使用)phyper(): > overlap <- 100 > list1 <- 500 > totalPop <- 10000 > list2 <- 1000 > > 1-phyper(overlap-1, list1, totalPop-list1, list2) [1] 4.103051e-12 それは合理的に聞こえますか? Bonferroni補正を適用したい場合は、このp値に比較回数を掛ける必要があります。この場合、比較の数は何に対応しますか?List2?あるいは、保守的な修正を減らすための迅速な方法は何でしょうか(たとえば、Benjamini-Hochberg)。