2つの遺伝子発現サンプル間の重複は重要ですか?


8

私は、熱ショックによって引き起こされたストレスに対する酵母(5000個の遺伝子を含む)の応答を研究する実験を行いました。37℃で過剰発現している48遺伝子のリストと42℃で過剰発現している145遺伝子のリストがあります。それらの両方で過剰発現する38の遺伝子があります。

偶然にも、両方で1つの遺伝子のみが過剰発現すると予想していましたが、取得したオーバーラップが有意である場合、どうすれば計算できますか?どうすれば値を取得できますか?私は生物統計学や数学のソフトウェアについて何も知りません。どうもありがとうございます!!!どんな助けでも大歓迎です:)p


オーバーラップを示すベン図を作成できます。
Michael R. Chernick

しかし、どうすればp値を計算できますか?
ローラ

p値は常に仮説との関係で計算されます。ここで調査したい仮説は何ですか?異なる遺伝子が異なる温度で過剰発現しているということですか?
MånsT

37℃で過剰発現した遺伝子は42℃でも過剰発現するという仮説があります。また、37℃と42℃の両方で38の遺伝子(合計48の遺伝子のうち)が過剰に発現しているため、そうである可能性があります。
ローラ

これは、検定できる統計的仮説ではありません。あなたはp値を探しているとは思いません。重なり具合を測って欲しいと思います。
Michael R. Chernick

回答:


4

テーブルはこんな感じ

                37 deg C
42 deg C     yes      no
yes          38       97
no           10      4855

はいといいえは、過剰に表現された場合とそうでない場合を指します。SASでフィッシャーの正確検定を実行しました。出力は以下に貼り付けられます。

Laura Gene expression data 


The FREQ Procedure


Statistics for Table of Group by expressed

Fisher's Exact Test 
Cell (1,1) Frequency (F) 4855 
Left-sided Pr <= F 1.0000 
Right-sided Pr >= F 4.776E-53 

Table Probability (P) 8.132E-51 
Two-sided Pr <= P 4.776E-53 
Sample Size = 5000

フィッシャーの正確検定のp値が0.0001よりはるかに小さいことがわかります。

これは、両方の温度で観察された38の過剰発現が、独立性のもとで期待する1.296と予想されるものよりもはるかに大きいことを正確に示しています。


3

Michaelが言及した正確なテストは、おそらく問題を解決するために使用することをお勧めする方法です(最小限の仮定)。参考までに、対応する一般的な統計検定は、独立性の検定になります。χ2


1
カイ2乗検定もノンパラメトリックですが、漸近理論が必要です。フィッシャーの検定には、固定二乗という追加の仮定があり、カイ二乗およびその他の分割表検定では仮定されていません。
Michael R. Chernick

@Laura明確に定義されたテストの問題がありました。それを見つけるために多くの前後の議論が必要だったのは残念です。
Michael R. Chernick

マイケル、ありがとうございました!これで、使用する必要があるテストとデータの入力方法がわかりました。あと2つだけ質問があります。オンラインのフィッシャーの正確なテスト計算機はありますか?私はSASを持っていないので、より多くのp値を計算したいと考えています。そして、あなたのテーブルでは、私が考慮しなければならないp値は何ですか?多分両側の確率?再度、感謝します!!!:)
Laura

1
ローラ...両面Pr。 incrementalskills.com/sisa/statistics/fishrhlp.htm(「手順に移動」リンク)。オンライン計算機は、あなたにその低いp値を与える忠実度に欠けています。
russellpierce
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.