"景先生毕设|www.jxszl.com

基于底盘生物klebsiellaoxytoca固氮基因簇合成生物学重构的生物信息学分析【字数:11409】

2024-11-03 13:22编辑: www.jxszl.com景先生毕设

目录
摘要 III
关键词 III
ABSTRACT IV
KEY WORDS IV
引言 1
1 数据与方法 2
1.1 密码子选用分析 2
1.1.1 基因组数据的获取 2
1.1.2 密码子使用频数表的统计 2
1.1.3 各密码子相对同义密码子使用度RSCU值的计算 2
1.1.4 各密码子相对适应度w值的计算 3
1.1.5 mRNA的GC含量计算 3
1.1.6 密码子适应指数CAI值的计算 3
1.1.7 有效密码子数ENC值的计算 3
1.1.8 mRNA各窗口的调和翻译速率的计算 4
1.1.9 调和翻译速率最低点的百分位置MP值的计算 4
1.1.10 参数之间的相关性分析 5
1.1.11 氨基酸序列的聚类分析 5
1.1.12 RSCU的聚类分析 5
1.2 RBS选用分析 5
1.2.1 RBS重构的实验数据 5
1.2.2 全连接神经网络的搭建与训练 6
1.2.3 穷举重构nif基因簇的RBS组合文库 7
1.2.4 预测RBS组合文库的效率 7
2 结果与分析 8
2.1 nif基因簇密码子选用偏好性分析 8
2.1.1 各样本的密码子RSCU值表及密码子相对适应度w值表 8
2.1.2 GC3%与GC12%、ENC值的关系 11
2.1.3 GC3%、MP值与CAI值的关系 11
2.1.4 其他密码子使用参数之间的相关性 12
2.1.5 各样本nifH的AA聚类 13
2.1.6 各样本的RSCU聚类 13
2.1.7 各样本nifH的调和翻译速率 14
2.2 机器学习预测最佳RBS组合 14
2.2.1 MLP神经网络训练结果 14
2.2.2 预测RBS组 *51今日免费论文网|www.51jrft.com +Q: #351916072
合文库的效率 15
2.2.3 预测最佳的RBS组合 16
3 讨论 18
3.1 nifH密码子使用情况的整体评价 18
3.2 mRNA翻译速率分布情况差异的推论 18
3.3 引入MP值的生物学意义 18
3.4 以机器学习方法为特色的nif基因簇重构流程 19
致谢 20
参考文献 21
附录A 调和翻译速率的数学意义 23
附录B 模型预测的最佳重构方案序列 24
附录C 本课题中的部分R语言程序源代码 28
基于底盘生物Klebsiella oxytoca固氮基因簇
合成生物学重构的生物信息学分析
摘 要
Klebsiella oxytoca是一种用于研究生物固氮的模式生物,其固氮酶的合成需要nif (nitrogen fixation)基因簇中数十种基因的协同作用。固氮合成生物学领域的一个重要研究方向是将K. oxytoca的nif基因簇在其他生物体内完成重构工作,其中一种方案是采取密码子随机化策略以消除不利的调控,并采用人工设计的RBS (ribosome binding site, 核糖体结合位点)组合平衡各组分的表达量。本课题一方面通过对以K. oxytoca为代表的固氮微生物中nifH的密码子选用情况进行分析,试图寻找密码子选用偏好性现象在nif基因簇中的体现。发现固氮微生物可能采取提高密码子第三位的G+C含量的策略提高nifH的表达量,或潜在地通过使核糖体在mRNA上提前减速实现,为密码子随机化策略提供指导及约束条件。另一方面,本课题在固氮合成生物学领域首次提出以机器学习方法为特色的nif基因簇重构流程,建立了一个全连接神经网络模型,将不同RBS组合重构方案及其对应固氮效率代入模型训练,预测使用计算机穷举的RBS组合文库对应的效率,并通过模型计算出了一个潜在的高效重构方案。对于密码子选用及RBS选用这两个主要影响表达量的因素进行分析,将有望在非固氮生物中nif基因簇自下而上的重构工作起到一定的引导与优化作用。

原文链接:http://www.jxszl.com/nongxue/zwbh/607358.html