基于极限学习机的基因表达数据分类算法研究

来源 :中国计量学院 | 被引量 : 0次 | 上传用户:dejia2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
极限学习机(Extreme Learning Machine,ELM)具有分类速度快,分类精度高的优点,已经越来越多地用于基因表达数据分类中,但是个体极限学习机具有分类的不稳定性。随着分类技术的发展,集成学习可以克服单个极限学习机用于数据分类时性能欠稳定的缺点,已经成为分析基因表达数据获取生物学信息的有力工具。然而当所给样本的误分类代价不相等时,对基因表达数据进行分类就不能仅仅以提高分类精度为目标,应该在高分类精度的基础上最小化误分类代价。本文将针对基因表达数据的分类进行研究,主要内容如下:(1)提出了极限学习机的相异性集成算法(D-ELM):分别基于两种测度提出了基于输出不一致测度的极限学习机相异性集成算法(D-D-ELM)和基于错误一致测度的极限学习机相异性集成算法(DF-D-ELM)。首先对相异性测度(输出不一致测度、错误一致测度)进行分析,建立相应的剔除规则;然后对极限学习机进行相异度的判断,根据相应的剔除规则剔除冗余的极限学习机;采用多数投票技术集成筛选后的极限学习机;最后用该集成系统对基因表达数据进行分类。实验表明:D-ELM算法能够有效提高极限学习机的分类精度,并且能够进一步得出DF-D-ELM算法要优于D-D-ELM算法。(2)提出了极限学习机的代价敏感学习算法(CS-ELM):首先在分类时引入概率估计的思想,将分类概率与误分类代价相结合;然后在此基础上进一步嵌入拒识代价实现极限学习机的代价敏感分类。实验表明:CS-ELM算法,虽然牺牲了误分类代价较低的大类别样本的分类精度,但降低了整体样本的误分类代价,实现了最小化误分类代价的目的。(3)提出了嵌入代价敏感的极限学习机相异性集成算法(CS-D-ELM):该算法首先利用D-ELM算法的思想对极限学习机进行筛选,剔除冗余极限学习机;然后结合CS-ELM算法的思想最小化误分类代价。实验表明:CS-D-ELM算法既能有效提高样本的分类精度,又能达到降低误分类代价的目的。
其他文献
<正> 包围着噪声、振动的环境发生了大的变化,以下,展望最近一个时期噪声、振动领域里的明显动向。1、噪声、振动测定技术1)噪声发出声音,人们就会听到这种声音.
水利是国民经济的基础产业和基础设施,是经济社会可持续发展的重要支撑;水利现代化是经济社会现代化的基本前提和必要条件;农村水利现代化是水利现代化的重要组成部分。2011年
本文对287例鼾症的手术作了临床分析,治疗以腭咽成形术及自创的软腭缩短术为主,287例中术后鼾声完全消失194例(67.6%),鼾声明显减轻90例(31.4%),无明显改善3例(1%),210例憋气型鼾症患者中,术后憋气现象完全消失134例(66.7%),明显
劳动教育在高校人才培养过程中长期缺位。高校劳动教育体系要坚持价值性原则、层次性原则、渗透性原则、共享性原则、示范性原则以及时代性原则。从新时代高校劳动教育的科学
可控机构和变胞机构是近年现代机构学领域提出的重要概念,将两者结合应用于工程中,生成面向任务的可控变胞机构,既具有可控机构可调可控、输出柔性、机电耦合的功能,又具有变
裂隙非饱和渗流及摩擦滑动特性研究属基础性研究,同时其研究成果又能应用于工程建设、油气开采、地热开发和地震预警等领域。裂隙非饱和渗流和摩擦滑动特性研究的关键在于精
英语存现句是句法学研究的热点问题之一,其句法特征是:虚词there居于句首,而动词却与动词后的名词一致。语言学界对英语存现句的研究主要围绕以下三个问题:there的范畴特征是什么
棉花是棉纺织品生产的重要原料。近年来,随着我国内需和出口的增长,棉纺织品的生产需求也日益旺盛。同时,国务院关于印发物流业调整和振兴规划的通知中明确要求加快棉花现代