【摘 要】
:
随着DNA测序技术的发展和应用推广,人类从基因层面不断探索着疾病背后的遗传密码。拷贝数变异是与许多人类复杂疾病相关的重要结构变异形式,提高拷贝数变异的检测精度成为越
论文部分内容阅读
随着DNA测序技术的发展和应用推广,人类从基因层面不断探索着疾病背后的遗传密码。拷贝数变异是与许多人类复杂疾病相关的重要结构变异形式,提高拷贝数变异的检测精度成为越来越迫切的需求。传统检测方法对于拷贝数变异的检测存在数据局限性以及精确度和敏感度不足的问题。本文创新性地提出了一种基于深度学习的拷贝数变异检测方法。本文的主要研究内容如下:(1)对基因数据的研究和仿真。研究二代和三代测序数据从测序序列到完成比对再到检测产生基准数据的全过程,对过程中不同类型数据格式和处理方法进行研究,针对拷贝数变异进行数据仿真研究,扩充拷贝数变异数量以及平行对比真实数据为拷贝数变异的特征研究提供充足样例,为后续拷贝数变异的检测和可视化方法奠定基础。(2)对基因序列数据的可视化研究。在研究序列数据的基础上,挖掘基因数据中的拷贝数变异特征,将其转换为更具可读性的深度学习网络图像输入。结合检测结构变异的四大策略:双末端映射、映射深度、分裂片段和序列拼接,研究对于突出拷贝数变异特征的可视化方法,为深度学习卷积神经网络模型的分类做数据铺垫。(3)对拷贝数变异的集成检测方法研究。为了提高检测拷贝数变异的精确度和敏感度,通过集成多个检测工具的结果提高检测敏感度,同时使用卷积神经网络模型对候选变异位点集进行分类从而剔除其中的假阳性判定从而获取最终检测结果。(4)对二代和三代测序数据的检测研究。图像方法对于测序序列的展示关联了区域内多个读段并且对于不同平台的数据差异具有更高容忍度,图像方法对于二代测序不同平台的SNP及indel检测具有兼容性,然而对于拷贝数变异的检测还未在二代及三代测序上进行验证。实验结果表明,基于图像的拷贝数变异集成检测方法对于二代和三代测序数据均具有有效性,并在检测的精确度和敏感度都优于单个现有工具。
其他文献
创新是一个企业、一个行业甚至是一个国家可持续发展的动力源泉。当前,我国致力于建设创新型国家,在不断的加大创新力度、提高创新能力。企业作为市场中创新的主体,企业进行
随着计算机、网络以及大数据的兴起,越来越多的人需要通过网络进行数据交换以及信息共享。然而网络环境非常复杂,时时刻刻充斥着许多不稳定、不安全的因素,这使得用户的隐私难以得到保障。因此保证用户在获取信息时的隐私性是非常有必要的。Chor等人在1995年提出了私有信息检索(Private Information Retrieve),简称PIR。出发点是当用户向数据库查询自己感兴趣的信息时,保证用户查询的
企业社会责任(CSR)近年来颇受争议,企业是否需要承担社会责任一直以来没有定论。如若企业一味地追求经济效益,会造成一定的生产外部不经济性,此时就需要企业承担一定的社会责任。反过来说,企业承担社会责任能够有利于企业的发展,则企业会自愿承担社会责任;但若企业承担社会责任对企业发展没有帮助,甚至是不利,企业则不会承担社会责任或是出于被动地承担。究其根本,企业在权衡是否履行社会责任问题时考虑更多的是与企业
负面清单模式是指仅列出禁止或限制的领域、事项,以及其他方面的要求,对于没有列出的领域或事项,都属于允许或无特别要求的一种管理方式。使用负面清单模式对我国外商投资进
在有雨的天气下,摄像机捕获的雨天图像通常成像模糊不清,能见程度降低,这在很大程度上干扰了计算机自动检测、识别还有目标跟踪的能力。例如,在交通事故中的责任划分和警察对
近年来,飞秒激光在非接触、高精密、微尺度的微纳米加工领域得到了越来越广泛的应用。在对微结构进行加工时,由于不方便直接测量出所加工结构的深度信息,通常采用先离线测量
水泥混凝土是水泥、骨料、砂和水的拌合物,具有强度高、可塑性好等优良性能,在土木建筑工程中得到广泛应用。宏观上可以将混凝土看作是均匀的人造建筑材料,但当其配合比、搅拌、施工或养护不合理时,易出现局部蜂窝、离析、松散、孔洞等缺陷,严重影响其力学性能的发挥,甚至威胁到建筑物的安全。因此,如何运用各种检测方法来判断混凝土内部缺陷的性质和规模受到广泛关注和重视,目前比较成熟的无损检测方法有超声波法、地质雷达
改革开放以来,在全球金融危机频发等复杂宏观环境下,中关村高技术产业密集区正面临着巨大挑战。高技术产业作为研究开发投入高、研究开发人员比重大的产业,是中关村、也是我国优先发展的重点产业。其中,以中关村科技园区为中心的高技术产业密集区是典型的领跑者。然而,中关村产业集聚发展过程中却存在诸多问题:中关村原始创新能力不足导致核心技术缺失,进而导致产业经济发展的后劲不足,无法维持产业的长远发展。面对来自外部
豫西槐树坪金矿位于华北板块南缘的熊耳山地区,该区是我国重要的金矿矿集区之一。前人对区内金矿床的成矿物质和流体来源,尤其是金的来源存在较大争议。本文通过野外地质特征、镜下矿物观察以及传统和非传统稳定同位素等方法,查明了槐树坪矿床的基本地质特征,明确了区内构造系统对矿床的控制形式,以及矿石组构和矿物组合类型;确定了矿床的成矿物质和流体来源;提出矿床的成矿作用过程。槐树坪矿床的地层以中元古代熊耳群和新生
近年来,国际上关于非O157大肠杆菌,尤其是“big six”暴发流行的报道逐渐增多,已成为重要的食源性致病菌之一。食品加工及贮藏过程中,各种栅栏因子联合应用可对有害菌产生抑制甚至杀灭效应,但越来越多的研究发现它们有可能产生交叉保护作用,提高细菌的存活率,反而增大了食品风险。非O157大肠杆菌与O157相似,也具有较强耐酸性,目前关于热休克-酸应激对非O157大肠杆菌存活的影响,尤其是应激过程中应