基于马尔可夫模型与支持向量机的剪接位点识别研究

来源 :中国科学院研究生院(本部) 中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:leiguo152
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,大量的动植物模式生物基因组序列已被测序。然而,从基因组序列的大量原始数据中发现基因仍然是一个有挑战性的问题。基因识别已成为生物信息学研究的重要问题之一。其中,剪接位点的识别是所有基因结构识别算法中的关键一步。基于马尔可夫模型与支持向量机,本文提出MM-SVM、马氏串核函数和HMM-SVM3种剪接位点识别算法,也研究了RNA二级结构特征对提高识别率的有效性。本文主要包含以下内容:   1)对基因序列用马氏过程建模,用SVM学习马氏过程的参数,提出新的基因信号识别算法MM-SVM,该方法能快速准确地识别出基因中的剪接位点等重要信号的位置。   2)提出一类从马氏过程得到的串核函数。实验证实,该类核函数对供体位点的识别率优于已有的其它方法。   3)对基因序列用隐马氏模型建模,用SVM代替传统的贝叶斯决策,提出HMM-SVM方法来识别剪接位点,该方法优于单纯的HMM识别算法。   4)基于RNA序列统计特征,结合二级结构特征识别剪接位点。并从信息论的角度,论证了二级结构特征对基因信号识别的有效性。
其他文献
交通事故已逐渐成为当今社会的“第一杀手”,据相关数据表明,疲劳驾驶是造成交通事故的一个主要原因。因此,如何有效地检测和预防疲劳驾驶,对降低交通事故的发生具有重要的现实意
在三维散乱点云模型曲面重建领域中,隐式曲面重建技术因具备易于实现交、差、并等集合操作,能准确表示拓扑结构复杂的几何形体,对轻微的噪声不敏感等特点,受到国内外专家学者的高
生物特征识别技术是近年来计算机视觉和模式识别领域中的一大热点问题。作为这项技术的一个新成员,手背静脉识别受到越来越多的关注。目前这种技术存在三个难点,第一是可见光下
学位
粗糙集理论作为一种强有力的数据分析和知识获取工具,正被越来越多的学者尝试应用到实际的生产过程分析中,然而面对日益庞大的数据库记录以及丰富的不确定信息,现阶段粗糙集理论
城市公共交通是与人民群众生产生活息息相关的重要基础设施。改革开放以来,我国城市公共交通有了较快发展,但随着经济社会发展和城镇化进程的加快,我国各大中城市交通拥堵、群众
在语音识别和语音合成的应用系统中,经常会遇到发音词典中没有的单词,因此需要提供一个模块自动的为这类单词注音,这个任务称为单词的字音转换(grapheme-to-phoneme conversion)
本文取得的主要研究成果有: (1)分析了量子粒子群算法(QPSO)的特点,提出了改进的量子粒子群优化算法(IQPSO),并给出量子编码、解空间变换、粒子状态更新、量子变异等实现的
本文主要就焊缝跟踪算法和焊接参数控制算法展开研究,并由此提出了一套切实可行的控制方案,实现了离线示教式自动化焊接系统的基本功能。 首先,在对焊缝轨迹特点充分研究的基
目前,随着科技水平的进步,人们对焊接质量的要求越来越高,为了保证焊接质量,通常配备焊缝自动跟踪系统。视觉传感方式由于其采集信息量大,避免了与工件直接接触,易于实现焊接跟踪智
如今,在全球经济一体化的过程中,特别是通信技术的飞速发展,计算机技术的日新月异的前提下,以欧洲的几大电力巨头公司(ABB,SIEMENS,AREVA)为首的IEC国际电工委感到无论是以前