棉花ad组正选择基因遗传参数研究
目 录
1 引言 1
2 材料和方法 2
2.1 数据源 2
2.2 直接同源和重复 2
2.3 PSG计算 2
2.4 功能注释 3
2.5 基因表达分析 3
2.6 统计测试 3
3 结果与讨论 3
3.1 亚洲棉比雷蒙德式棉有更多的PSGs 3
3.2 亚洲棉和雷蒙德式棉的遗传特征和基因表达的比较分析 5
3.3 亚洲棉和雷蒙德式棉 PSGs的WGD保留能力与基因功能的比较分析 7
结 论 13
致 谢 14
参 考 文 献 15
1 引言
经典的群体遗传学认为,真核生物基因组中的基因一般分为三类,中性进化的基因、负选择的基因以及正选择的基因。所谓正选择是指当一个群体中出现能够提高个体生存力或育性的突变时,具有该基因的个体将比其它个体留下更多的子代,而突变基因最终在整个群体中扩散。最近人们对检测基因和基因组区域的兴趣日益浓厚,这种兴趣源于对选择的推论,这些基因和基因区域已经经历了自然的正选择。它提供了重要的功能信息以及学习人类和其他有机体的进化过程的基本欲望。积极的选择比随机漂移更有力,尤其是在固定在群种中,它可以显著增加有利突变的频率。正选择在基因进化的新功能中 *51今日免费论文网|www.jxszl.com +Q: ^351916072#
起着重要的作用[1]。此外,正选择可能在基因复制过程中也发挥了特别重要的作用[1,2]。在不同的生物体中,如与宿主病原体相互作用、感觉感知、繁殖和免疫相关的不同基因中,都有大量的正选择发挥力量的依据。
利用多种种群遗传和分子进化方法可以检测出正选择。种群遗传方法最适合于探索最近或正在进行的选择,特别是那些在个别地方进行的并受到侧翼等位基因的影响的选择。然而,分子进化方法通常采用种内的多态性数据,特定的散度数据,或两者的组合[1,3],最适合于探索在较长时间内运行的选择过程,通常涉及多个位点。此外,分子进化方法可以更准确地识别出在较长的进化时间尺度下,通过连锁不平衡的衰变而发生的功能重要替换的具体位置[4]。检测选择的主要分子进化方法是将非同义取代(Ka)与同义取代(Ka/Ks)的比值进行比较。当没有选择或同义和非同义替换以相同的速率发生时,Ka/Ks比率等于1。在负选择期间,Ka/Ks < 1;而Ka/Ks > 1,则为正选择期间。因此,Ka/Ks可以用于检测选择,以及确定选择方向,这一比例是一种非常常见的工具,用于识别各种进化遗传场景中的选择过程。
各种基因组测序的完成促进了分子进化方法的改进和应用,通过在基因组范围内确定正选择。然而,最近相对综合调查的模式选择的影响主要集中在哺乳动物基因组中的正选择,从相对较弱的动力检测基于三个代表基因组高度相似,人类、黑猩猩、猕猴,更系统的研究涉及六个哺乳动物的基因组,包括人类[5]黑猩猩、猕猴,小白鼠[6],老鼠,和狗[7]。据粗略地透露,PSGs主要用于防御/免疫、化学感知和生殖方面的作用。与非PSGs相比,PSGs在较低的层次上以组织特有的方式表达[4]。PSGs在X染色体上更常见。尽管如此,在植物基因组中,即使是在蛋白质编码区,仍有很多不清楚的选择。迄今为止,对植物基因组中选择模式的唯一系统研究涉及拟南芥中的核苷酸结合位点leucinerich repeat (NBSLRR)基因家族,其中163个核苷酸序列中只有103个被确定为正向选择。
随着基因组测序技术的出现,各种棉属物种如雷蒙德氏棉(雷蒙德式棉)[8],草棉(G。 herbaceum),亚洲棉(G。 arboretum)[9],陆地棉(G。 hirsutum)[10]和海岛棉(G。 barbadense)在过去几年中被完全测序。棉属包括45个二倍体(2n = 2)和5个四倍体(AD1到AD5, 2n = 4)种[8,11]。亚洲棉(A2)和雷蒙德式棉 (D5)是两个二倍体棉种的当前后代,可以进一步杂交以产生新的异源多倍体棉花品种[12]。原产于非洲的亚洲棉基因组二倍体和墨西哥雷蒙德式棉二倍体在基因组大小上有两倍的差异,因此在农艺性状和生理特征上存在差异。他们的基因组序列的释放用于研究不同的棉属物种的进化变化并回答基本的进化问题提供了一个前所未有的机会。
在目前的研究中,一个确定的特定氨基酸残基进行了正选择采用的计算ω(Ka / Ks)[13] 的似然比(LR)方法。我们最初在两个测序的棉花基因组中鉴定了469和297个PSGs,然后分别计算了亚洲棉和雷蒙德式棉的Ka、Ks和Ka/Ks。我们的数据表明,在亚洲棉的PSGs比雷蒙德式棉表现出显著的低Ka、Ks,高Ka/Ks,较短的基因长度,和较少表达的基因。此外,与雷蒙德式棉相比,亚洲棉的大多数PSGs在最近的全基因组复制事件后被保留为一份拷贝,这说明在亚洲棉基因组中,PSGs在与亚洲棉分离后可能具有更重要的功能。
2 材料和方法
2.1 数据源
从棉花网(https://www.cottongen.org/)和可可基因组数据库(http://www.Cacaogenomedb.org/)下载了亚洲棉、雷蒙德式棉和T.cocoa的基因组序列。
2.2 直接同源和重复
在两个物种中,直接同源之所以被定义为同源基因,是因为它们起源于共同的祖先。我们通过使用InParanoid软件确定了亚洲棉和雷蒙德式棉之间的同源关系,该软件可以识别一对多和多对多的正交关系[14]。根据之前的研究确定了重复序列。我们首先通过MCScanX[15]发现了两种棉花基因组的WGD基因集和合成区域。为了提高对WGD基因对的预测的准确性,在分析中只包含了116 (亚洲棉)和640 (雷蒙德式棉)大型重复基因组片段的基因对和单例。这些基因对被认为是由发生在1660万年前的异源多倍体事件(mya)[8]所形成的,而且它们不仅受到序列同源性的支持,而且还受到一种共体关系的支持。
原文链接:http://www.jxszl.com/nongxue/zwbh/66564.html
最新推荐
热门阅读