"景先生毕设|www.jxszl.com

基于rnaseq数据的大豆调控组共表达数据库的构建【字数:9189】

2024-11-03 13:31编辑: www.jxszl.com景先生毕设

目录
摘 要 III
引言
大豆是世界范围内重要的农作物及人类主要食物之一,是主要的经济作物,是食用油、生物燃料等的重要来源。大豆还能通过根部的天然固氮作用提高土壤中的氮含量,改善土壤结构[1]。植物的生长发育过程受到非常精细的调控,其中转录和转录后水平的调控发挥了主要的作用。许多调控因子例如DNA和组蛋白修饰、转录因子、microRNA、长链非编码RNA、内源siRNA等均能够精细对基因表达进行调控,利用RNAseq可以分析调控分子在不同组织发育、胁迫响应过程中的表达情况,进一步理解植物的生长发育调控机制。
RNAseq,即新一代测序技术(next generation sequencing, NGS),也叫做高通量测序技术(Highthoughtput sequencing),是通过使用高通量测序技术进行cDNA测序,从而获取转录本丰度,对DNA进行定量研究[2]。目前,RNAseq 可以使用多种测序平台(Roche/454、Illumina/Solexa和ABA公司的SOLiD),对于不同的实验目的要采用不同的建库方法[3]。迄今为止,Illumina/Solexa 测序平台上的 RNASeq 最为普遍。
转录组测序(RNAseq)已经被广泛应用于动植物的研究当中,在植物中,RNAseq 被用来研究不同组织,不同发育阶段,不同胁迫条件下的基因表达分析。随着RNAseq技术的不断发展,测序成本降低,测序质量提高,我们对RNAseq的依赖也越来越广泛。通过进行RNAseq,首先可以获得样本的基因类型,经过功能注释,获取我们感兴趣的基因的结构和功能;其次,可以获取组织特异表达和分析不同条件下的差异表达;第三,还可以根据RNAseq数据分析SNP位点以及融合基因和鉴定长链编码RNA或环状非编码RNA等[4]。到目前为止,NCBI的GEO数据库收集很多各种植物的RNAseq数据,通过使用RNAseq的方法对植物的研究已经越来越成熟。
非编码RNA(noncoding RNAs, ncRNAs)是一类广泛存在生物体且不编码具有催化活性的RNA分子,ncRNAs可分为环状ncRNAs和线性ncRNAs,其中linear ncRNAs包括小ncRNAs如microRNAs和长链n *51今日免费论文网|www.51jrft.com +Q: ^351916072
cRNAs(lncRNAs)。近些年来,在植物中研究的最多的就是miRNAs,其他ncRNAs的研究也大有增长趋势。
miRNA是一类内源性非编码小RNA,通过miRNA基因转录成miRNA的初级转录本(primiRNAs),DICER蛋白将初级miRNA转录本加工成成熟的miRNA,成熟的miRNA进入ARGONAUTE蛋白,组装成沉默复合体(RISC),靶向mRNAs,负调控基因的表达,从而调控植物的生长发育[5]。miRNA在植物生长过程中起着重要的调控作用,包括各发育阶段的调控。
miRNA可以调控植物从幼年期向成年期的转换。研究表明,植物幼年期向成年期阶段转变受miR156SPLs途径调控。大豆 miRNA 不但在大豆生长发育,生物和非生物胁迫以及结瘤固氮等方面具有重要意义[6]。
长链非编码RNA(long noncoding RNA, lncRNA)是一类长度大于200个核苷酸,没有阅读框架,但往往具有mRNA结构特征(5‘端帽子和3‘端ployA尾巴)的RNA[7]。长链非编码RNA的基因不编码蛋白质,但它们具有强大的生物学功能。有研究表明,lncRNAs在诸如剂量补偿、基因印迹、转录调控、mRNA剪接和mRNA翻译等不同的生物途径中发挥功能[8]。
lncRNAs可以参与植物的春化作用诱导植物开花。拟南芥含有一种对开花有抑制作用的蛋白FLOWERING LOCUSC(FLC),冬天的低温和春化作用可诱致表观遗传的打开,其中Polycomb Repressive Complex2 (PRC2)在FLC位点富集组蛋白三甲基化,FLC便不再表达,从而使得可以经过冬季低温后在春天开花[9]。
相位siRNA(phased siRNA or phasiRNA)是一类由miRNA介导生成的首尾相连,具有相位排列结构特征的植物内源siRNA[10]。PhasiRNA同其他内源性siRNA一样,对于植物的生长发育具有调控作用。植物中的phsiRNA大多聚集在生殖组织中,并在生殖期间靶定并沉默转座元件[11]。除了调控植物的生殖发育,phasiRNA还会响应生物或非生物胁迫。PhasiRNA影响植物的生长发育。在花发育过程中,phasiRNA在花序中大量表达[1213]。
植物花序中的phasiRNA大多是由miR2118介导产生[1415]。在玉米和非洲稻中,花药减数分裂前期,由miR2118触发产生的21nt phasiRNA在花粉囊中积累;在减数分裂期,miR2275触发产生的24nt phasiRNA聚集于绒毡层和性母细胞[16]。长日照条件下,PSMS系水稻中控制光敏雄性不育基因PMS1(photopheriodsensetive genic male sterility 1)的初级转录本能被miR2118介导切割成21nt的phasiRNA,phasiRNA的积累最终会导致水稻的雄性不育[17],对于研究水稻的两系不育系具有重要意义。 PhasiRNA参与植物对非生物胁迫和生物胁迫的响应。比如R基因中存在多个PHAS位点,且产生的phasiRNA也多数靶向R基因,以应对病菌的入侵[18]。PhasiRNA 在大豆中的研究还不是太明确,有待进一步研究。
转录因子是通过结合目的基因的启动子序列中的特殊元件来调节基因的表达的一种蛋白质,进而在植物生长发育中起着重要的作用[19]。WRKY 转录因子家族基因在大豆的生物胁迫和非生物胁迫的基因调控中发挥着重要作用,主要通过将大豆WRKY家族基因转入拟南芥,烟草或百脉根,毛状根等来研究大豆抵抗非生物胁迫的生物学功能[20]。因为大豆与根瘤菌共生的关系,转录因子是研究大豆基因表达的一个关键因素,在调控网络中发挥着举足轻重的作用。
本实验充分利用目前大量的RNAseq数据,计算lncRNAs、phase 基因以及TF在大豆各个组织和胁迫条件下的表达水平,增加基于tau[21]组织特异表达模块和基于PCC的在线共表达模块,在实验室已有生物信息学平台https://cbi.njau.edu.cn/上搭建基于约278个RNAseq数据的大豆调控组表达数据库网站,实现提供转录因子基因、lncRNA和Phase gene在大豆不同组织和处理下的表达量查询;提供组织或处理的调控因子特异表达的检索;提供不同调控组成员之间表达关系图谱等多种功能,相关大豆科研人员可以依据数据库的表达数据,做一些生物信息分析,揭示特定调控组的功能机制。

原文链接:http://www.jxszl.com/nongxue/zwbh/607449.html