论文部分内容阅读
人类基因组工作草图绘制完成后,生命科学已进入后基因组时代,结构生物学正处在具有战略性的关键地位,研究蛋白质的结构与功能,特别是蛋白质的三维结构,是揭示基因组功能的基本途径。冷冻电镜技术作为结构生物学重要的研究手段正扮演越来越重要的角色。
三维密度图的可视分析是冷冻电镜技术分析生物大分子结构最基本、最重要的方法之一。本文对密度图可视分析的三个关键技术:可视化、分割和匹配进行了深入地研究,提出了新的算法和方法,并在此基础上研究开发了冷冻电镜密度数据的可视分析软件。本文的主要贡献如下:
1.对密度图的可视化,提出了改进的渐进立方体算法,提高了等值面生成的速度;根据应用领域和数据的特点,构造了新的属性数据场,在此基础上提出了新的颜色映射方法,即基于位置信息的着色法和基于连通区域的着色法;
2.对冷冻电镜三维结构模型的分割,提出并实现了两种自动分割算法,即基于渐进立方体标记法的分水岭分割算法和多目标快速行进法自动分割算法。基于渐进立方体标记法的分水岭分割算法对三维密度体数据的较大尺度自动分割,对无对称和低对称生物大分子有较好的效果。多目标快速行进法自动分割算法对高对称的复杂球形病毒大分子取得了较好分割效果。与传统软件的纯手工方法相比,本文的分割方法使用方便,省时省力,而且是对三维数据体而不是等值面的分割,不会因为等值面值域的改变而需要重新分割等值面;
3.对单晶体结构在密度图中的匹配,提出并实现了极值吸收法与梯度法相结合的自动匹配方法。用极大值点来代表冷冻电镜密度图,用高密度的原子代表原子模型,使用迭代法计算出两者点的对应关系,把匹配问题转化成绝对定向问题,利用航空测量领域中常用的解析法求解其绝对定向坐标变换,在每次迭代中利用绝对定向法计算出变换矩阵的解析解,得到粗网格的匹配,最后用梯度法使得晶体结构原子模型在密度数据力场的作用下精细调整,得到最终的匹配结果;同时,本文还提出并实现了基于匹配的分割方法,运用该方法可以根据匹配结果,自动地把与晶体结构匹配的密度图分割出来;
4.对多个晶体结构在密度图中的匹配,提出了基于对称性的匹配方法。根据一个非对称单元晶体结构在密度图中的匹配结果,利用密度图空间对称性和四元数旋转,实现所有非对称单元晶体结构在整个密度空间的自动匹配;
5.研究开发了冷冻电镜可视分析软件VAT4M,形成具有自主知识产权的软件系统,已提交给生物学家使用,通过帮助生物学家在科研中实际处理和分析冷冻电镜重构的密度图,证明该系统的理论意义和应用价值。