冷冻电镜电子断层三维重构算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:sunnywwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
冷冻电镜三维重构技术凭借其无需结晶、保持生物样品活性状态以及快速解析等优点,成为了研究生物大分子高分辨结构及其生物学功能的强有力的手段,其研究意义得到学界的追捧,更获得了2017年诺贝尔化学奖。其中,冷冻电镜电子断层三维重构技术凭借其无需纯化制样的优势,为深入研究分子机器在原位环境下的运作机理提供了无可替代的技术手段。  近年来,通过将冷冻电镜电子断层三维重构技术和子区域平均技术相结合,原位生物大分子高分辨率结构以及相关机理研究的重大成果层出不穷,极大地促进了结构生物学的发展。然而,冷冻电镜三维重构技术仍然面临两个瓶颈问题,极大地制约了其重构分辨率的提高和广泛应用。第一、由于采样策略的限制,往往无法采集到冷冻电镜样品的高角度信息,从而导致重构结果中存在信息缺失,即所谓的“缺失楔”问题,该“缺失楔”会在重构结果中引起伪迹,从而严重影响对生物样品的分析,同时“缺失楔”的存在也会严重影响子区域平均技术的颗粒对齐精度,限制其重构分辨率;第二、由于冷冻电镜电子断层三维重构技术具有大尺度、高通量的特性,导致其对计算资源和自动化算法有着严重的依赖。对大型计算设备以及操作人员专业知识的过高需求,会提高冷冻电镜电子断层三维重构技术的技术门槛,不利于其在重构分辨率上的进一步发展。  针对上述两个问题,本文对冷冻电镜电子断层三维重构技术中的重构算法、高性能算法以及自动化算法三个方面进行了深入地研究,提出了一系列有效解决上述问题的关键技术,并通过真实实验数据验证了方法的有效性。本文的主要贡献包括:  1.本文提出了基于滤波的迭代重构算法(FIRT),实现了对于负染和树脂包埋等具有较高衬度的生物样品三维重构过程中缺失信息恢复的功能。首先,本文针对传统时域迭代重构算法的重构分辨率与迭代次数之间的关系进行实验分析;然后,在此基础上,将非线性滤波操作融入迭代框架中,从而提出了新的、具有信息恢复能力的算法框架;最后,本文设计了一个交叉验证流程,用于评价所恢复信息的置信度,并在此基础上进行频域滤波,以去除置信度较低的恢复信息。实验结果表明,FIRT算法对于具有较高衬度的生物样品,具有良好的信息恢复功能,能有效缓解“缺失楔”的影响。  2.本文提出了基于压缩感知理论的频域傅里叶重构算法(ICON),实现了对于低信噪比冷冻样品的缺失信息恢复功能。首先,本文针对冷冻电镜生物样品特性进行深入分析,提出了更为贴近其本质的“非负”先验,以增强在高噪声情况下,压缩感知理论的信息恢复能力;然后,在此基础上,本文提出了电子断层三维重构领域首个基于匹配追踪的迭代重构框架,以增强新算法对噪声的鲁棒性;最后,采用与FIRT算法类似的交叉验证流程,对所恢复信息进行置信度评估,并去除置信度低的恢复信息。实验数据表明,ICON算法除了对具有较高衬度的生物样品有优秀的缺失信息恢复能力外,对于具有低信噪比的冷冻生物样品同样具有良好的信息恢复功能,并能有效提高后续子区域平均技术的重构分辨率。  3.本文提出了基于GPU的高性能电子断层重构算法(ICON-GPU),解决了ICON算法严重依赖计算资源的问题。首先,本文对ICON算法的计算流程进行分析,将其具体运算操作划分为三个类别;然后,针对每一个类别的运算操作设计并实现了一种基于GPU的加速算法,其中,针对非均匀傅里叶变换的GPU加速策略更被整理为一个独立模块,可供常规的频域迭代重构算法,如INFR算法等调用。实验数据表明,ICON-GPU算法在保证重构精度和信息恢复能力的同时,具有可观的加速效果,峰值加速比可达83.7倍。  4.本文提出了全自动的电子断层几何参数测定算法(AutoGDeterm),解决了传统电子断层几何参数测定过程中需要人工标注边界模型、易于引入主观误差的问题。首先,本文对电子断层几何模型进行了详细分析,并给出了关于几何参数独立测量的误差估计;然后,本文对不同重构算法的重投影图像进行了对比,并借此阐明了ICON算法重投影的优势;最后,本文设计了一系列数值分析策略精确求解各个几何参数。实验数据表明,AutoGDeterm算法在实现全自动测量的同时,具有可与人工标注测量算法相媲美的测量精度。  本文为文中所提出的四个新算法均开发了相应软件,并提供开放下载。
其他文献
随着数据仓库、数据挖掘技术的广泛应用,ETL(Extract,Transformation,Loading)作为数据仓库建设中的重要步骤越来越受到开发人员的重视,它决定着数据仓库数据质量以及决策分
学位
农业机械在农业生产中广泛应用,引发了农业生产方式的根本变革,大幅度的提高了农业劳动生产率和土地产出率,使从事农业的人口下降,使更多的人能够从事第二产业和第三产业的工作,从
随着计算机网络的广泛使用,互联网领域的迅速发展,现代信息系统的分布性、异构性和自治性特征越来越受研究机构及产业界的关注。系统中信息资源不仅分布在异构的计算机环境中
虽然现有的高校综合教务管理系统能够适应教务管理的需求,但在信息安全技术方面的应用却相对薄弱。为防止数据被篡改和确保数据的机密性,目前仍然采用手工签名和信件交换机制,然
数字地质调查过程即整个地质矿产资源调查过的数字化实现,整个地质调查过程最终贯穿于一个大型计算机软件系统。通过无缝一体化原则设计的地质调查软件实现了地质数据采集、数
学位
无线传感器网络(WSN)是继因特网之后、深刻影响人们生活方式和生产过程的新一代综合技术,它引起了学术界和工业界的广泛关注。一般的传感器节点是由电池供电的低能量设备,更
贝叶斯网络(Bayesian Networks, BNs)是一种基于概率论和图论的不确定知识表示模型,它一方面用图论的语言直观揭示问题的结构,另一方面又按照概率论的原理对问题的结构加以利
多agent系统,尤其是多agent学习方法,近年来有长足的发展,在解决很多实际问题中取得了很好的应用效果。但是随着研究的深入,多agent学习领域也迎来了新的挑战。多agent系统可扩展
近年来,传感器技术、低功耗的微电子技术、无线通信技术的进步,为无线传感器网络(WSN)设计和应用创造了条件。微型电子医疗仪器及临床医疗信息系统成为医疗电子化的趋势,而WS
学位
全超导托卡马克EAST(Experimental Advanced Superconducting Tokamak)实验装置内部结构复杂,有众多的诊断部件并且涉及大量诊断信息,这些信息对实验的作用至关重大。虚拟EAS
学位