遺伝子リストの充実度をテストするためにどの統計テストを使用すべきですか?


10

特定のDNA損傷物質に対する細胞の感受性をテストする実験を行いました。薬剤に対して特異的に感受性のある270の遺伝子が見つかり、分析された遺伝子の総数は3668でした。270の感受性の遺伝子のうち38は「DNA修復遺伝子」に分類されます。ゲノムに含まれる「DNA修復遺伝子」の数が112で、ゲノム内の遺伝子の総数が3668である場合、DNA修復遺伝子の高感度遺伝子濃縮ですか?どの統計検定を使用する必要がありますか?オンラインでp値を計算するためのツールも教えていただければ幸いです。

回答:


17

遺伝子リストの充実度をテストする標準的な方法は、超幾何テストまたは片側フィッシャーの正確確率検定を行うことです。次の分割表があります。2×2

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

R次のようにテストを実行できます。

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

これは非常に重要な結果をもたらします:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

(表現不足ではなく)表現過剰についてテストしているため、alternativeパラメーターはに設定されていることに注意してください"greater"


1
回答ありがとうございます。また、フィッシャーの厳密検定は分析に適した方法である可能性もあります。私もテストしたい他の関数クラスの結果を実行する統計ソフトウェアはありません。すべての小数を含むpvalueを取得する「オンライン」ツールを知っていますか?
ローラ

1
Rは無料でダウンロードできます。r-project.orgを参照してくださいしたがって、ソフトウェアがないことは問題解決します(そして、オンラインで計算する方法が必要だと考えるのは間違っています)。ただし、これらのことを自分で確認するために少し検索してください。良い質問をすることについてのアドバイスはstats.stackexchange.com/help/how-to-askでご覧ください。
Nick Cox

@ニックあなたのアドバイスは良いですが、ポスターの特徴としてそれを非難しないでください。したがって、私はあなたのコメントの予備的なフレーズを削除しました(それはそれに情報を追加しませんでした)。
whuber

このための優れたオンラインツールは次のとおり

正確に計算されているものの過剰表現について、さらに説明していただけますか?
sdgaw erzswer
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.