噬菌体与细菌的互作信号预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:szneptune
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噬菌体是专一感染细菌的病毒,它和细菌在自然环境里共同存在、共同进化,然后影响着整个生态环境的功能。由于噬菌体具有宿主特异性高,指数增殖能力强,不良反应少和种类极其丰富等特点,应用噬菌体实现对复杂肠道菌群的调节和改造将有助于研发新型治疗剂,治疗耐药菌的感染以及进行噬菌体靶向治疗。随着高通量测序技术的普及,越来越多具有缺失宿主信息的病毒序列迫切需要利用生物信息学方法来预测它们的宿主以及病毒-宿主动态相互作用对微生物群落的影响。本项研究旨在通过融合多个噬菌体与宿主互作信号和使用多种机器学习算法来综合性地预测噬菌体与宿主相互作用。方法:1.搭建和开发关于预测噬菌体与细菌单个互作信号的服务器环境,工具与算法,互作信号主要是CRISPR,原噬菌体,遗传同源性,蛋白质-蛋白质互作以及序列组成(寡核苷酸频率模式)。2.建立数据库,从NCBI以及参考文献所提到的数据里下载了13,055个细菌基因组和10,463个噬菌体基因组,基于这些基因组和搭建好的环境建立关于这5类噬菌体与细菌互作信号的数据库,以便进行后续预测分析。3.开发算法流程,分别建立噬菌体宿主预测,细菌互作的噬菌体预测以及噬菌体-细菌对的互作性预测的算法流程,利用7种不同的机器学习算法(随机森林,决策树,贝叶斯,逻辑回归,支持向量机)对已知的噬菌体-细菌互作对的18个信号特征进行模型训练,结合两层互作标准,实现单个信号和综合性预测。结果:噬菌体与细菌互作预测算法实现了三个角度的双向预测,预测宿主,互作的噬菌体以及评估一对噬菌体-细菌的互作性,关于原噬菌体预测,除了使用已发表的工具外,还开发了一套结合基于密度的空间聚类算法和滑窗法来预测原噬菌体区域算法。对于这5个互作信号,定义了相关的18个能代表噬菌体与细菌互作的信号特征,其中,机器学习模型使用10倍交叉验证法,利用817对已知互作的噬菌体-细菌对7个模型进行参数训练,在取得最优参数后,使用不同于训练集的936对已知互作的噬菌体-细菌作为测试集,预测准确率高达0.875,且ROC曲线下的面积AUC达到了0.93。此外,利用standalone版本预测125,842个宏基因组病毒contigs的宿主,预测率高达54.54%,而原文章只有7.7%。Webserver已经搭建成功,提供了丰富和个性化的图形展示,网站已有来自多个国家的人访问和使用。
其他文献
与传统孔板、涡街、涡轮流量计相比,气体超声波流量计具有较高的测量准确度和测量重复性。特别是在大口径天然气管道的流量测量方面,其优势更加明显。但是,由于超声波信号在气体中传播时,能量衰减严重。随着气体流速的增加,回波信号幅值变小,信噪比降低,容易受噪声干扰,导致气体超声波流量计的测量准确度和测量范围都受到限制。为此,本文从对回波能量积分的角度,得出了回波信号能量的变化规律,提出了一种基于回波能量积分
随着我国桥梁工程的不断发展,桥梁结构的耐久性问题和安全性问题已经逐步发展成为关键的问题,本文主要对这两个方面的问题和对策进行了统计和分析。其中,桥梁结构耐久性问题主要
目的:探讨生命早期应用抗生素对小鼠体质量、脂代谢、胰岛素以及对小鼠肠道菌群的影响。方法:将2周龄昆明小鼠144只随机分为静脉注射给药对照组(注射生理盐水)、单抗生素静脉
近年来,随着我国经济高速发展和旅游事业的不断发展,人们的消费水平提高和消费理念转变,从原简单的观光旅游转变为“慢生活”的体验,人们对精神文化层面,文化修养,人文历史,传统文化方面也有了强烈的追求。为了更好的促进我国经济发展,提高人们的生活品质,文化修养,因此在温泉酒店室内设计的过程中满足功能需求的同时,也应该深入研究历史精髓,弘扬优秀传统文化。本文以新中式风格为出发点,以营口奕心汤温泉酒店室内设计
目的:健康促进生活方式作为影响个人健康的一个主要因素,与形成健康有关的习惯密切相关。饮食营养不均衡、经常熬夜、作息时间不规律等,使得大学生生活方式存在健康问题,大学
【目的】建立立木材积模型,为科学计量评价森林资源、完善森林资源监测体系提供重要依据。【方法】以海南省相思树为研究对象,以胸径和树高为自变量建立二元山本材积式模型、
从新中国成立以来,工业时代的文化产物随着工业文明的兴起逐渐兴盛,以工业为主体的当代艺术作品逐渐问世。而由发展所遗留下来的废弃工厂是时代变革的产物,是时代的烙印。这