"景先生毕设|www.jxszl.com

基于转录组的鱼虾精巢差异表达基因分析(附件)【字数:6805】

2024-02-24 15:47编辑: www.jxszl.com景先生毕设
本研究分别通过比较分析成年凡纳滨对虾(t)和孵化后30天(L30X)、180天(L180X)尼罗罗非鱼精巢转录组数据,筛选出L180X与L30X间2,756个差异表达基因,其中1,105个上调,1,651个下调;L180X与t之间18,087个差异表达基因,全为下调;L30X与t间18,642个差异表达基因,全为下调。通过GO功能富集分析发现两物种在翻译水平和翻译后调控有明显区别,通过KEGG分析显示凡纳滨对虾与不同时期的罗非鱼在MAPK信号通路(MAPK signaling pathway)中注释数目最多,在信号传导和生化代谢相关通路中均有富集。本研究旨在通过对成年凡纳滨对虾和不同时期尼罗罗非鱼精巢转录组数据的比较分析,了解两物种基因表达情况的差异,为遗传育种基因改良提供依据。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1材料与方法2
1.1 测序数据及其质量控制2
1.2 转录组数据与参考基因组序列比对2
1.3基因表达量分析2
1.4 差异表达分析2
2 结果与分析2
2.1测序数据及其质量控制2
2.2转录组数据与参考基因组序列比对3
2.3基因表达量分析3
2.4差异表达基因分析4
2.4.1 GO功能富集分析4
2.4.2 KEGG注释及KEGG pathway富集分析5
3 讨论6
3.1基因表达量分析6
3.2差异表达分析6
4结论7
致谢7
参考文献7
图1差异表达基因文氏图4
图 2 KEGG通路富集散点图5
表1本文中用于分析的转录组数据描述统计表3
表2 样品测序数据与参考基因组的序列对比结果统计表3
表3差异表达基因数目统计表3
表 4 注释的差异表达基因数量统计表4
鱼虾精巢差异表达基因的分析
引言
凡纳滨对虾(Litopenaeus vannamei) *51今日免费论文网|www.jxszl.com +Q: ^351916072
原产于东太平洋的温暖水域,由于其生长迅速、抗病能力强、对盐度及温度变化适应快、对日粮蛋白质需求少等特点,已成为最受欢迎的甲克类养殖品种,并且是三大养殖对虾中单产最高的品种[12]。尼罗罗非鱼(Oreochromis niloticus)原产于非洲,为丽鱼科鱼类,是十分重要的动物性蛋白质来源,在世界范围内被大量养殖[34]。
随着科技的进步,基因组学、转录组学等技术逐渐运用到水产中,转录组数据的分析能够让人了解基因的差异表达,对关键的基因和代谢通路定位,并找到与其关联的特定生理现象,这为研究生物生长发育等提供了有效帮助[56],在遗传育种方面也有着不可估量的作用。将先进的现代生物技术应用于水产养殖遗传育种中,通过转录组学研究,寻找甲壳类和鱼虾性腺之间的共有特征和各自特点,建立基因池,并通过转基因等技术,打破物种间遗传物质间的屏障,解决各自的繁殖育种、生长发育等问题,不仅能满足人们对于数量和质量的需求,还有利于我国水产业的种质资源的可持续发展[710]。
近年来已有关于凡纳滨对虾和尼罗罗非鱼雌雄性腺间的转录组学研究。Peng等[1]完成了第一次虾性腺的大规模RNA测序,确定了许多与凡纳滨对虾性别相关的功能基因。 Tao[11]等人对罗非鱼性腺转录组进行了最大程度的收集,发现雌雄技术受体都在XX型性腺中表达,然而孵化后5天的XY性腺中只有雌激素受体表达,解释了外源性类固醇引起罗非鱼性逆转的原因。
本课题基于前人高通量测序获得的成年凡纳滨对虾和尼罗罗非鱼孵化后30、180天精巢转录组数据,通过比较转录组学研究,寻找它们之间的基因表达情况的差异,为水产动物转基因育种提供参考。
1 材料与方法
测序数据及其质量控制
选取Peng等[1]在2015年构建的凡纳滨对虾精巢cDNA文库(NCBI的SRA数据库,检索号为SRR2060962)用t代表,选取W Tao等[11]在2013年构建的罗非鱼孵化后30天与孵化后180天精巢cDNA文库(NCBI的SRA数据库,检索号分别为SRR526903、SRR521273)分别用L30X与L180X代表。为获得Clean Read,将原始数据进行过滤,移除接头序列,低质量序列和PloyN部分,同时计算Clean Read的碱基质量值(Q10,Q20,Q30),GC含量和序列重复度[12]。
转录组数据与参考基因组序列比对
本课题选取罗非鱼全基因组作为参考基因,利用TopHat2软件,将Clean Reads与参考基因组进行序列对比,得到在参考基因组上的位置信息,以及测序样品特有的序列信息。高质量且对比效率高的数据是进行后续分析的基础。
1.3 基因表达量分析
使用Cufflinks软件的Cuffquant和Cuffnorm组件,通过Mapped Read在基因上的位置信息,对转录本和基因的表达水平进行定量。采用FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)作为衡量转录本或基因表达水平的指标。FPKM计算公式如下:

公式中,位于分子的cDNA Fragments表示为比对到某一转录本上的片段数目,即为双端Reads数量;位于分母的Mapped Fragments (Millions)表示比对到转录本上的片段总数,以10^6为单位;同样位于分母的Transcript Length(kb)表示转录本长度,以10^3个碱基为单位.
1.4差异表达分析
用DESeq R package (1.10.1)分析鱼虾两个生物学条件之间的差异表达基因集。将Fold Change>=2且错误发生率(False Discovery Rate,FDR)大于0.01作为筛选标准,P <0.05为差异表达。用BLAST软件将转录组数据与GO、KEGG数据库对比,获得注释信息。在两样本间的差异表达基因中,将CorrectedP value ≤0.05 作为评价标准,满足此条件为显著富集。KEGG Pathway显著性富集分析是以KEGG数据库中Pathway为单位,通过超几何检验,找出与整个基因组背景相比,在差异表达基因中有显著性富集的Pathway。

原文链接:http://www.jxszl.com/nongxue/scyz/560784.html