【摘 要】
:
串联质谱技术是蛋白质组学研究的重要技术,常用的串联质谱测序方法包括:蛋白质序列库搜索、从头测序、谱库搜索等。其中从头测序方法可以直接通过串联质谱推断出肽序列,该方法具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序问题的复杂性,导致其测序的准确率远低于数据库方法,制约了从头测序的广泛应用,针对这一问题,提出了一种基于图卷积神经网络(Gra
论文部分内容阅读
串联质谱技术是蛋白质组学研究的重要技术,常用的串联质谱测序方法包括:蛋白质序列库搜索、从头测序、谱库搜索等。其中从头测序方法可以直接通过串联质谱推断出肽序列,该方法具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序问题的复杂性,导致其测序的准确率远低于数据库方法,制约了从头测序的广泛应用,针对这一问题,提出了一种基于图卷积神经网络(Graph Convolutional Neural Networks,GCN)的从头测序方法denovo-GCN。基于图论的从头测序方法的核心思想是建立谱峰关系图,遍历图上路径进行测序。denovo-GCN将谱峰关系图与图卷积神经网络相结合形成了新的测序方法,该方法将质谱中谱峰之间的关系用图结构表示,从相应的碎裂位点提取谱峰特征,通过图卷积网络预测当前碎裂点处的氨基酸,逐步组成完整的肽序列。与基于图论的传统方法相比,denovo-GCN简化了谱峰数据的预处理过程,谱峰关系图和谱峰特征在模型框架内实现,候选序列无需进行二次打分,测序流程更为简洁。通过实验确定了模型层次结构、离子类型组合和谱峰数量3个影响模型的重要参数。采用多个物种数据集用于实验对比,实验结果表明,该方法在肽水平上的召回率比Novor高出9.8~21.1个百分点,比pNovo高出4~12.8个百分点,比基于卷积神经网络(Convolutional Neural Networks,CNN)和长短期记忆网络(Long Short-term Memory Networks,LSTM)的DeepNovo提高了2~10.6个百分点。通过实验对比分析了denovo-GCN和pNovo测序结果的top-10命中率,两类测序方法仍有较大的提升空间。总结了两类测序方法测序结果中出现的错误类型,借助肽谱标注的方法分析了目标肽序列和预测肽序列的差异,发现内部离子可以为测序提供更多的信息,并进一步验证了内部离子对模型的测序影响。
其他文献
配电变压器作为电力系统不可或缺的重要设备,其运行可靠性与配电网络的安全密切相关。当配电变压器发生外部短路故障时,绕组中通过较大的短路电流,其数值远高于正常状态下的额定电流,在漏磁场的作用下会在绕组上产生巨大的短路电磁力,从而引起绕组变形,通过不断的累积,致使线匝发生相对位移从而造成绝缘破坏。随着电压等级的不断提高,配电网络中各种事故层出不穷,尤其是变压器短路故障引起的事故不断增加,因此,分析研究短
随着5G浪潮的兴起,计算机、传感器、人工智能、云计算等前沿科技的不断发展,我国的智能驾驶开启了崭新的阶段。智能驾驶汽车是汽车产业的未来发展方向,是我国科技实力的重要体现,越来越多的车企、高校致力于智能驾驶汽车的研究。路径规划和路径跟踪是智能车研究领域中的关键部分,规划路径的质量和路径跟踪的精确性是衡量车辆智能化的重要标准。因此,本文在路径规划及跟踪控制方面做了深入研究,在充分分析各个规划、控制算法
由于氟原子的引入,有机含氟化合物能够表现出独特的物理特性、化学反应性以及生理活性。因此,有机含氟化合物在医药、农药以及功能材料等领域有着十分广泛的应用。亚砜类化合物作为重要的药物中间体,已得到了广泛的研究,但是对含氟亚砜化合物的化学转化研究相对匮乏。本论文主要利用芳基二氟甲基亚砜(Ar SOCF2H)为亲核试剂,进行了以下两部分工作:1)与卤代脂肪烃的芳基亚磺酰基二氟甲基化反应并其进行了相应的官能
基质金属蛋白酶(Matrix metalloproteinases,MMPs)是锌依赖性金属肽酶蛋白家族的成员,广泛存在于植物、动物和微生物中。MMPs通过降解细胞外基质(extracellular matrix,ECM)和基底膜(basement membrane,BM)参与调节许多生理过程、病理过程、伤口愈合和免疫应答等过程。但在脊椎动物中,MMPs家族基因亚型较多而且功能之间相互干扰,因此,
流体动力学方程是偏微分方程的重要研究领域.Navier-Stokes方程是流体动力学方程的主要模型,与Navier-Stokes方程相关的模型也是该领域研究的热点.本论文致力于自由边界条件下几类流体方程的局部、全局适定性等相关问题的研究.主要内容如下:第一章主要介绍自由边值问题的研究背景及意义,国内外研究现状,目前存在的研究问题以及本论文的主要内容.第二章主要介绍与论文相关的基础知识,函数空间几类
变分不等式是最优化领域当中一个十分重要的研究方向,它可以看作成统一处理多种最优化问题和平衡点问题的自然框架.在很多领域中有许多问题都可以通过转化为变分不等式问题来求解.例如在信号处理、图像恢复、矩阵填充、机器学习等信息技术中的许多问题都可以看作成一个凸优化问题,其中凸优化的一阶必要性条件可以转化为一个算子为单调的变分不等式(此时的算子是梯度).由于变分不等式中的算子其约束条件并不是固定不变的,而且
IN 718合金由于其优异的力学性能被广泛应用在航空航天等领域,但传统加工方式周期长,成本高,且结构复杂件难以制造。增材制造技术的出现很好地解决了这一问题,但增材制造与传统工艺制造的零件在组织和性能等方面具有显著差异。本文主要利用光学显微镜(OM)、扫描电子显微镜(SEM)、电子背散射衍射(EBSD)、X射线衍射(XRD)等技术研究了不同激光能量密度和不同建造方向下的激光选区熔化IN718合金的组
随着经济的快速发展,能源危机日益严重。如何更好地利用清洁能源以缓解能源危机成为人们越来越重视的问题。分布式电源(distributed generation,DG)的大规模应用在有效地缓解能源和环境危机的同时,也给配电网的协调控制带来了更大的挑战。通过分布式电源与储能联合进行配电网协调控制,可以充分的发掘配电网的调度潜能,降低分布式电源并网的风险,因此逐渐成为研究热点。随着智能电网双向互动技术的推
据sputniknews网站2021年1月1日报道,日本防卫省正在开发无人战斗机,并计划在2035年前装备部队。斯巴鲁公司和三菱公司正在参与这种无人战斗机的研发工作,其中斯巴鲁公司负责开发远程飞行控制技术,三菱公司负责设计无人机之间的信息共享系统。此外,日本也可能与英国或美国的公司合作研发。日本防卫省的目标是分三个阶段开发这种无人机,分别是制造无人机,用一架有人机控制多架无人机,以及设计和制
智能感官系统是通过模仿人类视觉、味觉等感知机理研发的一种新型现代化智能分析检测系统,通常由传感器、信号传输模块以及模式识别算法组成。其中,模式识别对系统检测的准确性起决定性作用,但目前针对智能感官系统的模式识别算法较为单一,限制其检测效率。同时,单一智能感官系统获取样本片面的有效信息,而多感官融合目前主要基于传统浅层机器学习算法实现,影响数据的融合效果。本文基于电子舌系统和电子眼系统,提出基于深度