基于神经网络的蛋白质二级结构预测

来源 :北京科技大学 | 被引量 : 0次 | 上传用户:yangdod
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命活动的重要承担者,它的生物功能和属性是由蛋白质的结构决定的,因而蛋白质结构预测对理解蛋白质结构与功能的关系和生物制药等领域有重要的意义。蛋白质二级结构预测是蛋白质结构预测的重要组成部分,起着承上启下的作用,是蛋白质结构预测关键的步骤。   然而传统蛋白质结构预测方法存在着预测精度低,依赖服务器,预算开销过大,单用一种方法缺乏与其它方法优势互补等问题,严重制约了生物信息学的发展。   机器学习是一种比较好的蛋白质二级结构预测方法,本文利用基于序列比对搜索算法的神经网络预测模型。首先,由于数据库里蛋白质数量巨大,本文采用了时间复杂度较小的Ukkonen算法作为搜索蛋白质同源信息的基础。在建立神经网络模型进行预测阶段,鉴于神经网络的收敛速度慢,容易陷入局部极小值的问题,本文用粒子群和模拟退火方法对神经网络进行优化,然后利用同源信息对蛋白质进行结构预测。   在实验中,对两个常用测试数据集进行测试,与常用的预测方法进行比较,取得了较好预测精度。并且基于预测模型的程序独立,不依赖任何服务器,简单易用,可以离线操作,不需要大量资金的开销,对计算机系统的要求不高。   虽然本文的方法取得了较好的预测结果,但面对小量的测试数据,因为找不到较好的同源信息,部分预测精度较差。最后本文提出了解决此问题的思路,综合使用多种预测方法和采用集成的方式进行预测。
其他文献
煤炭是一个特殊行业也是一个高危行业。煤矿安全管理是煤矿企业管理的一个十分重要的环节,煤矿安全管理的好坏,不但关系到煤矿企业的发展和前途,更加关系到每个矿井工作人员
性能是软件系统最重要的属性之一。如果系统无法达到预期性能,就要长时间进行调优,甚至导致项目最后以失败告终。目前,针对不同硬件体系结构,并行构件应用程序的执行性能可能差异
研究指出制造执行系统(MES)能有效消除信息孤岛,提高企业的生产效率,减少企业的生产成本,从而使企业在竞争激烈的市场占据优势。因而在企业实施信息化过程中,MES的实施至关重要。
中文分词是中文信息处理的基础,也是其一直存在的基本问题,有着极其广泛的实际应用。可以说,在各类中文信息处理软件(系统)中,中文分词是不可或缺的环节。自上个世纪末,由于互联网
随着互联网技术的快速发展和广泛应用,网络文化正以空前的广度和深度渗透到当代大学生学习与生活的方方面面。不良校园网络文化的传播严重威胁着大学生的价值取向、政治态度、
数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的实际应用的数据中,提取隐含在其中的、人们事先不知道的信息和知识的过程。它是信息技术未来的发展方向。本文依
中医学作为中国特色的传统医学具有重要的社会价值,如何充分利用现代科技手段改造中医的运用方式,完善中医的内部整合,是提高其疗效,扩大其影响力,实现中医现代化的重要措施。将中
随着网络银行、淘宝、支付宝等原本陌生的词汇日益变得耳熟能详,电子商务的蓬勃发展,网上支付、网上转账、网上缴费逐渐步入现代人的生活。与此同时,网上交易的安全性,更具体到身
钻井计算机模拟是用来在室内借助计算机并根据已建立的工程数学模型,模拟并再现钻井施工全过程的一种工程模拟仿真。计算机动态仿真模拟可以克服诸多困难,比如场地限制、经费不
指纹识别技术是一种应用最广泛的生物识别技术。它的核心是指纹匹配算法。人们在长期的研究过程中,提出了多种指纹匹配算法。近几年,隐马尔可夫模型被应用于指纹匹配研究。但