miRNA前体与成熟体预测方法的设计与实现

被引量 : 0次 | 上传用户:propelling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
microRNA(miRNA)是一类重要的内源性非编码RNA基因,它的长度很短通常只有大约21nt,能够对靶标mRNA的表达起着调控作用。参与了一系列重要的生长发育过程,包括植物的新陈代谢、抗病毒和动物细胞的增殖、凋亡等,并且和癌症等多种疾病的发生有着密切的关系。本文提出并实现了基于SVM的miRNA前体分类和成熟体预测方法,取得了良好的预测性能。首先,已知miRNA前体候选序列,提出并实现了基于SVM的植物miRNA前体分类模型和相应网站服务。本文从拟南芥和大豆的蛋白质编码序列中提取了假的茎环序列,这些假的茎环序列是在此项研究中首次提取得到。为了提高miRNA前体分类的性能,本文设计并实现了基于图的冗余特征去除方法和基于信息增益的特征选择方法。同时,基于miRNA前体在样本空间中分布,选择有代表性的miRNA前体作为训练样本。针对8个植物物种,本文建立的分类模型PlantMiRNAPred取得了超过90%的准确度。其次,已知判定为真的miRNA前体,提出并实现了基于SVM的植物miRNA成熟体预测模型和相应网站服务。根据miRNA的生源学,将miRNA:miRNA*作为一个整体,以提取植物miRNA更多的特征。本文提取了单核苷酸的位置相关特征、能量相关特征、结构相关特征和稳定性相关特征。选取信息增益较大的特征以提高miRNA成熟体预测准确度。设计并实现了两阶段样本选择方法以解决真/假miRNA:miRNA*的不平衡问题。根据高维样本空间中的反例样本的分布密度,选取有代表性的反例训练样本。本文的方法能够准确的预测植物miRNA的位置。与已有预测算法相比,该方法取得了更高的预测性能。该预测模型能够给出假定miRNA的位置,有助于通过生物实验验证更多的miRNA前体和成熟体候选序列。
其他文献
1 中学物理自助学习法的初步设想将自助用于中学物理学习之中,我们称之为"中学物理自助学习法".作为一种体现素质教育要求的学习方法,它不同于传统的学生被动接受知识的学习
本文从当前世界各国理论界和实务界对产品责任的主要认定标准和中国相关立法入手,借鉴民事诉讼证明中的盖然性规则,建立起一套较为科学合理的产品缺陷认定标准体系,以弥补我
"无救济的权利是无保障的权利"。高等教育法律救济具有体现民主和标志法治的功能,文章论述了高等教育法律救济的特征和意义,指出了高等教育法律救济的途径,依法保护高等学校
罗非鱼(Tilapia)隶属于鲈形目、鲈形亚目、丽鱼科(Cichlidae)、罗非鱼属(亦称丽鲷科,丽鲷属)。由于罗非鱼具有杂食性、生长快、繁殖力强、适应性广等优点,目前已成为世界性主
针对不方便断电拆线的场合,设计了一种开合式微型电流互感器来代替常规电流互感器,从而实现在线安装.通过选择方形铁芯,选用磁导率较大且切口平整、气隙较小的铁氧体为铁芯材
随着经济发展以及资本市场的日益繁荣,现行财务报告所披露的信息呈现出越来越大的信息落差,且因此而不断受到利益各方的质疑。综观学术界与实物界对现行财务报告的批评,基本
针对智能交通系统中的车牌图像识别问题,提出了一种在形状上下文特征提取算法的前提下,基于多种现有度量算法相结合的联合度量策略的图像识别机制。首先,描述了基于形状上下
<正>校长,是学校常规管理的"头儿"。学校常规管理工作是保证学校环境优美、风气纯正、秩序井然、质量优良的基础性和关键性工作,也是学校工作中最常态、最繁重、最琐碎及最重
樗蚕(Philosamia cynthia Wakker et Felder)为鳞翅目大蚕蛾科,近两年在河北省部分地市形成灾害.2002年7月起,我们在秦皇岛市区对第2代樗蚕及其天敌进行观察,对照书本记载发
程序性细胞死亡配体-1(PD-L1)通常由癌细胞产生,其通过表达在T细胞上的受体PD-1抑制免疫功能。然而,PD-L1和PD-1是否能调节疼痛和神经元功能并不清楚。本研究显示黑色素瘤和