観察された対立遺伝子頻度は予測よりも大幅に少ないですか?


10

質問:観察された「山」対立遺伝子頻度(図1)が生態学的選択モデル(詳細は以下を参照)によって予測された(図2)よりも中央から南部の山で著しく低いかどうかを判断するテストを構築するにはどうすればよいですか?

問題:私の最初の考えは、緯度:経度と高度に対してモデルの残差を回帰することでした(これにより、緯度と経度の間の相互作用のみが重要になります)。問題は、残差(図3)がモデルによって説明されない変動を反映していること、および/またはそれらが生物学的に起こっていることである、たとえば対立遺伝子がそのポテンシャルまで南に広がる時間がない、または遺伝子の流れに対する何らかの障壁があることです。観測された(図1)と予想された(図2)の山アレル頻度を比較すると、特にスウェーデンとノルウェーの中央から南部の山では明らかな違いがあります。モデルがすべてのバリエーションを説明しない可能性があることは認めますが、山岳対立遺伝子が中部山脈から南部山脈でその可能性に達していないという考えを調査するための合理的なテストを考え出すことはできますか?

バックグラウンド:私はバイアレルAFLPマーカーを持っています。その頻度分布は、スカンジナビア半島の低地生息地と山(および緯度:経度)に関連しているようです(図1)。「山」対立遺伝子は、山岳地帯である北部でほぼ固定されています。それは山が欠けている南の「低地」対立遺伝子のためにほとんど欠けているか固定されています。山の中を北から南に移動すると、「山」対立遺伝子はより低い頻度で発生します。北から南への「山」対立遺伝子頻度のこの違いは、地域が北と南の両方から植民地化されたため、単純に系統地理学または歴史的プロセスが原因である可能性があります。たとえば、山岳対立遺伝子が北部の人口に由来する場合、おそらく南部の人口に完全に拡大する時間がありませんでした。

私の作業仮説は、「山」対立遺伝子頻度が生態学的選択の結果であるというものです(帰無仮説は中立選択です)。

私の生態学的選択モデルでは、応答変数として二項対立遺伝子頻度(通常、各サイトで10から20の個体がサンプリングされたフェノスカンジナビア全体で129のサイトでサンプリング)と、いくつかの気候および成長期変数を使用して、一般化加法モデル(GAM)を使用しました。予測変数。モデルの結果は次のとおりです(TMAX04-06 = 4月から6月の最高気温、Phen_NPPMN =平均成長期の植生生産性、PET_HE_YR =年間の潜在的な蒸発散量、Dist_Coast =海岸までの距離):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

ここに画像の説明を入力してください

図1.二重対立遺伝子AFLPマーカーで観察された「山」対立遺伝子頻度。等高線は0.1の周波数間隔であり、カラーシェーディングは高度であり、青は最低、赤は最高です。

ここに画像の説明を入力してください

図2.二対立遺伝子AFLPマーカーの予測される「山」対立遺伝子頻度。等高線は0.1の周波数間隔であり、カラーシェーディングは高度であり、青は最低、赤は最高です。

ここに画像の説明を入力してください

図3.生態学的選択モデル(GAMを使用)の残差は、調査地域全体(フェノスカンジナビア)とノルウェー、スウェーデン、フィンランドで個別に分類されます。赤い破線は、他のAFLPマーカーから推測される北部と南部の個体群の二次接触ゾーンと、アフリカの別の越冬地で成長した羽の安定同位体分析を表しています。細い黒い点線がゾーンの中心です。


1
たくさんの詳細をありがとう。ヌルモデルはどのようにして問題になるのですか?観察されたものと期待されたものを比較する際には、生態学的選択モデルのみが重要であるようです。
gui11aume 2012年

ここにあなたの実際のデータは何ですか?モデルの出力には「n = 129」と表示されますが、これは129の個体、またはそれぞれの位置に129の対立遺伝子頻度がある場所ですか、それとも...
ワンストップ2012

申し訳ありませんが、私が開発している原稿に対する私のアプローチのロジック(または非論理的)をすべての人が最もよく理解できるように、できるだけ多くの背景を提供したいと思いました。私の質問は一番上に立っています。観察されたものと期待されたものの違いが大幅に異なるかどうかを判断する理由を見つけたいと思います。これにより、対立遺伝子がまだ広がっているか、期待値に到達するのに何らかの障壁があるかがわかります。「N = 129」については、これが対立遺伝子頻度であるため、これは129サイトを意味し、通常、各サイトで10〜20人の個体がサンプリングされます。
Keith Larson

あなたは、個人が母性および自家遺伝子座の汎流行性であるように見えることを言及します。これらのデータにアクセスできますか?汎ミキシングをどのように評価しましたか?
2012年

回答:


1

この質問は死んだかもしれませんが、ここのグラフは豪華で、ここでの答えは直感的に明白に感じられます。「山」の対立遺伝子を探している場合は、予測子として高度(またはその代替)を使用するのが明らかです。それが対立遺伝子頻度との有意な関連を示した場合、それはあなたの仮説の強力な証拠を提供するでしょう。

標高よりも山のその他の側面を説明する予測変数を追加する場合があります。たとえば、地形の「荒さ」や植生タイプなど、一意に山があり、対立遺伝子の頻度にも関連付けられている場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.