基于CUDA的符号回归算法并行设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:renewmyself
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息存储的急剧增长,人们迫切需要从海量数据中提取有用的信息与知识,并将获取的有用经验广泛用于商务管理、生产控制、市场分析、工程设计和科学探索等。而符号回归算法则是数据挖掘在科学计算领域的一个重要研究方向与课题。简单地说,符号回归即是在一组大量的相关变量的数据样本中,搜索出一个符号形式的数学公式,来以指定的精度拟合数据。目前解决该问题的方法多是基于遗传规划算法来实现的,但由于其编码的复杂性与变异过程的不易操作性,本文采用基于基因表达式程序设计(GEP)的新型进化算法,它结合了遗传算法定长线性编码方式与遗传规划算法易于表达复杂结构的优势,使得其在实际应用尤其是符号回归问题上表现的相当出色。为了改进传统GEP算法的性能与精度,本文选用GPU作为并行计算平台,使用Nvidia公司推出的统一计算设备架构CUDA这一编程模型,将GEP遗传算法中计算量最大的适应度值求解过程放在GPU上并行处理,充分发挥了GPU的计算性能,并得到了满意的加速效果。而在算法正确性方面,本文在个体的进化算法过程中融入了本地搜索算法,最小二乘方法(MLS),旨在个体每次进化出固定结构后,不断地优化常系数,使其最大精度的满足实验样本数据,从而改善每个染色体的适应度值。本文实验部分,选取了30组从国外文献中摘取出来的,具有代表意义的实验样例,分别从算法性能与成功率两方面进行实验。在速度对比实验中,基于CUDA的符号回归算法性能相对于串行程序能够达到250倍的加速比;而在搜索结果正确率比对实验中,嵌入MLS常系数生成算法的符号回归算法,无论在最优残差还是在平均残差的参量上都要优于其他几种常系数生成算法,进化搜索出来的公式能够更精确的拟合实验样本数据。
其他文献
多维数据的近邻查询是多媒体数据处理领域最常用的基本操作之一,并长期都是研究的热点。然而已提出的索引大多面临高维、海量等问题的困扰。由于矢量量化技术具有较好的数据量
随着电子商务和电子政务迅速发展,越来越多的像银行账号之类的个人信息要求严格保密,所以,如何保证信息的安全性显得尤其重要。作为信息安全的核心技术之一,密码技术具有极为重要
智能监控中的运动目标识别分类技术是计算机视觉领域的一个研究热点,随着科技的进步、社会的发展,各行各业对视频监控的需求不断增强,使得视频监控系统不断朝着智能化的方向
植物是自然界的重要组成部分,因其种类繁多、结构复杂、形态万千,以计算机技术为中心,建立在植物学、计算机图形学、数理统计、可视化技术基础上的虚拟植物(VirtualPlants)研究
随着计算机网络的迅猛发展和网络业务类型的快速增加,网络管理日益复杂,传统的网络难以保证用户的端到端QoS目标。认知网络在感知当前环境的基础上,同时结合业务需求,对网络未来
在大型客机全球化协同研制过程中,需要与全球先进的制造企业进行深入地交流,在协同研制的过程中,经常涉及到双方信息资产安全等诸多问题。本文针对大型客机的全球信息化协同研制
归纳学习的核心问题是从给定的数据集中抽取分类规则,决策树归纳是一种典型的分类规则抽取方法,扩展属性的选择是决策树归纳的核心问题,基于离散化的连续值决策树归纳在选择扩展
随着通信技术的不断进步以及各种通信方式的出现,通信交流已经成为人们生活中不可或缺的一部分。伴随着科技发展和社会的进步人们对于信息交流的要求也逐步提升。互联网、有
生物体基因的表达借助于具有调控作用的蛋白质和DNA序列中的调控位点的结合来完成,而调控位点出现在相关基因的上游调控区域,并且通常是保守的序列模式,即模体。因此,模体识别对
与传统公钥加密方案相比,基于格的公钥加密方案可抵抗量子攻击,同时其运算简单,运行速度快,因而成为改进传统公钥加密方案效率的新思路。基于LWE的加密方案是具理论安全性支持且