论文部分内容阅读
冷冻电镜三维重构技术凭借其无需结晶、保持生物样品活性状态以及快速解析等优点,成为了研究生物大分子高分辨结构及其生物学功能的强有力的手段,其研究意义得到学界的追捧,更获得了2017年诺贝尔化学奖。其中,冷冻电镜电子断层三维重构技术凭借其无需纯化制样的优势,为深入研究分子机器在原位环境下的运作机理提供了无可替代的技术手段。 近年来,通过将冷冻电镜电子断层三维重构技术和子区域平均技术相结合,原位生物大分子高分辨率结构以及相关机理研究的重大成果层出不穷,极大地促进了结构生物学的发展。然而,冷冻电镜三维重构技术仍然面临两个瓶颈问题,极大地制约了其重构分辨率的提高和广泛应用。第一、由于采样策略的限制,往往无法采集到冷冻电镜样品的高角度信息,从而导致重构结果中存在信息缺失,即所谓的“缺失楔”问题,该“缺失楔”会在重构结果中引起伪迹,从而严重影响对生物样品的分析,同时“缺失楔”的存在也会严重影响子区域平均技术的颗粒对齐精度,限制其重构分辨率;第二、由于冷冻电镜电子断层三维重构技术具有大尺度、高通量的特性,导致其对计算资源和自动化算法有着严重的依赖。对大型计算设备以及操作人员专业知识的过高需求,会提高冷冻电镜电子断层三维重构技术的技术门槛,不利于其在重构分辨率上的进一步发展。 针对上述两个问题,本文对冷冻电镜电子断层三维重构技术中的重构算法、高性能算法以及自动化算法三个方面进行了深入地研究,提出了一系列有效解决上述问题的关键技术,并通过真实实验数据验证了方法的有效性。本文的主要贡献包括: 1.本文提出了基于滤波的迭代重构算法(FIRT),实现了对于负染和树脂包埋等具有较高衬度的生物样品三维重构过程中缺失信息恢复的功能。首先,本文针对传统时域迭代重构算法的重构分辨率与迭代次数之间的关系进行实验分析;然后,在此基础上,将非线性滤波操作融入迭代框架中,从而提出了新的、具有信息恢复能力的算法框架;最后,本文设计了一个交叉验证流程,用于评价所恢复信息的置信度,并在此基础上进行频域滤波,以去除置信度较低的恢复信息。实验结果表明,FIRT算法对于具有较高衬度的生物样品,具有良好的信息恢复功能,能有效缓解“缺失楔”的影响。 2.本文提出了基于压缩感知理论的频域傅里叶重构算法(ICON),实现了对于低信噪比冷冻样品的缺失信息恢复功能。首先,本文针对冷冻电镜生物样品特性进行深入分析,提出了更为贴近其本质的“非负”先验,以增强在高噪声情况下,压缩感知理论的信息恢复能力;然后,在此基础上,本文提出了电子断层三维重构领域首个基于匹配追踪的迭代重构框架,以增强新算法对噪声的鲁棒性;最后,采用与FIRT算法类似的交叉验证流程,对所恢复信息进行置信度评估,并去除置信度低的恢复信息。实验数据表明,ICON算法除了对具有较高衬度的生物样品有优秀的缺失信息恢复能力外,对于具有低信噪比的冷冻生物样品同样具有良好的信息恢复功能,并能有效提高后续子区域平均技术的重构分辨率。 3.本文提出了基于GPU的高性能电子断层重构算法(ICON-GPU),解决了ICON算法严重依赖计算资源的问题。首先,本文对ICON算法的计算流程进行分析,将其具体运算操作划分为三个类别;然后,针对每一个类别的运算操作设计并实现了一种基于GPU的加速算法,其中,针对非均匀傅里叶变换的GPU加速策略更被整理为一个独立模块,可供常规的频域迭代重构算法,如INFR算法等调用。实验数据表明,ICON-GPU算法在保证重构精度和信息恢复能力的同时,具有可观的加速效果,峰值加速比可达83.7倍。 4.本文提出了全自动的电子断层几何参数测定算法(AutoGDeterm),解决了传统电子断层几何参数测定过程中需要人工标注边界模型、易于引入主观误差的问题。首先,本文对电子断层几何模型进行了详细分析,并给出了关于几何参数独立测量的误差估计;然后,本文对不同重构算法的重投影图像进行了对比,并借此阐明了ICON算法重投影的优势;最后,本文设计了一系列数值分析策略精确求解各个几何参数。实验数据表明,AutoGDeterm算法在实现全自动测量的同时,具有可与人工标注测量算法相媲美的测量精度。 本文为文中所提出的四个新算法均开发了相应软件,并提供开放下载。