基因比对算法在可重构平台上加速方法的研究与实验

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：huangwj03

【摘要】

：

进入二十一世纪，以高通量基因测序为代表的新一代测序技术，在医疗、制药及育种等多个领域得到快速发展及应用，催生了未处理的基因数据呈爆炸性增长。基因序列比对是基因测序流程

【作者】

：

叶琳

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2017年期

【关键词】

：

基因测序数据处理可重构计算系统加速方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

进入二十一世纪，以高通量基因测序为代表的新一代测序技术，在医疗、制药及育种等多个领域得到快速发展及应用，催生了未处理的基因数据呈爆炸性增长。基因序列比对是基因测序流程中的关键步骤，也是其性能瓶颈之一，因此如何高效计算处理基因数据成为相关研究的热点领域。本论文利用可重构计算系统对BWA软件包中Seed产生阶段的加速方法进行研究。具体实现采用OpenCL开发方式，该方式同传统HDL开发方式相比，具有开发实现快、节省人力资源以及跨平台兼容性好的特点。在算法的加速优化上，采用多PE的加速体系结构与优化访存措施相结合的策略提高执行效率，对比CPU单线程，获得了较明显的加速效果。本论文先选用两个可重构系统，并针对各自的特点定制加速结构，选择加速效果更好的系统作为最终的加速系统，主要贡献如下:　　1)对BWA软件包中Seed产生阶段C代码在X86通用处理器上的运行性能分析，得到该程序执行的效率瓶颈和热点函数，并将热点函数映射成FPGA上执行的两个核函数——核函数bwt_2occ4和核函数bwt_sa。测试发现该热点函数为非规则访存密集型、计算密度低。　　2)针对大数据可重构系统的自带大容量内存、均匀局部访存的结构特点，优化访存及定制多PE加速结构。核函数bwt_2occ4采用4个处理引擎(PE)并行加速，每个PE内部采用批处理、不定长循环展开、使用常量Cache三种优化措施。核函数bwt_sa采用4个PE并行处理。使用人类第1号染色体（约249MB）作为测试数据，核函数bwt_2occ4相较于Intel Xeon S2600WTTR Processor单线程模式的加速比为11.8，核函数bwt_sa的加速比为15.1。　　3)在Intel Xeon+FPGA共享内存一致性系统上，因加速算法不规则访存造成Cache不命中，使得直接映射的算法加速效率低。为解决该问题，本文采用CPU与FPGA协同加速与数据预处理方法，提高加速效率。在核函数bwt_2occ4的优化中，主机端使用6个线程整理数据并存储于数组，使设备端的随机访存转化为连续访存;设备端使用5个PE并行加速，每个PE内同时完成两对索引上下界对应的碱基数的计算，提升资源利用率。核函数bwt sa采用4个PE加速，每个PE内部将不定长循环所需数据块提前预取到FPGA内部，提高访存效率。使用人类第1号染色体(约249MB)作为测试数据，核函数bwt_2occ4相较于Intel Xeon S2600WTTR Processor单线程模式的加速比为2.6，核函数bwt_sa的加速比为3.2。　　4)对两种可重构系统上的相同算法的加速比差异，分析了可能原因并设计实验验证。此外，以核函数bwt_2occ4为例，通过加大Intel Xeon+FPGA系统的加速器中单PE读取数据的宽度，提高了互联带宽的利用率，加速比有了进一步提高。使用人类第1号染色体（约249MB）作为测试数据，核函数bwt_2occ4相较于Intel Xeon S2600WTTR Processor单线程模式的加速比为10.0，进一步证明实验结论。　　5)选择加速比更高的大数据可重构系统作为最终的加速系统，测试数据以hg19数据库中的全人类基因组(约3.2G)作为Reference，wgsim工具生成的DNA片段作为Read序列(Read的数量为1M，长度为101bp)，相较于2.4Ghz28线程的Intel Xeon S2600WTTR Processor单线程模式获得的加速比为:核函数bwt_2occ4为8.8，核函数bwt_sa为14.3。

其他文献

加密技术在网页保护中的应用研究

该文讨论加密技术在网页保护中的应用方案,提出了一个以许可证为用户身份认证标志的加密保护方案,它有效地避免了用户名/口令保护方式的安全风险和外接硬件保护方式的附加成

学位

加密技术网页保护许可证RC6加密算法安全性测试

平面区域包围盒算法研究

包围盒问题是计算几何中的基本问题之一.在诸如图像处理、模式识别、CAD等领域有着广泛的应用.平面区域最小面积凸多边形包围盒是包围盒问题系列中最核心问题.该问题简单地说

学位

平面区域最小面积包围盒遗传算法

演化计算在数值优化和组合优化中的应用

演化算法是基于生物进化论原理发展起来的启发式高效随机搜索方法,当前,演化算法在科学研究、工程设计优化求解领域得到了广泛应用,并获得了长足的发展.演化算法的设计研究与

学位

演化计算函数优化组合优化车辆路径问题基因库

嵌入式操作系统构件制作及管理软件的设计与实现

近年来,构件化操作系统成为研究热点,而对于嵌入式领域,因其软硬件丰富多样,对效率、规模要求严格等原因,需要操作系统能够非常灵活的定制,适应软硬件的变化,能够量体裁衣、

学位

嵌入式操作系统构件库嵌入式操作系统构件制作刻面分类

关联规则的有趣性研究

关联规则挖掘用于发现大数据集中数据间的关联关系,是数据挖掘技术中重要研究方向之一.关联规则兴趣度可以发现有趣的规则或模式.该文从客观和主观两方面讨论了目前常见的一

学位

数据挖掘关联规则兴趣度完全可信度联结度

马鞍山中行数据挖掘的设计与实现

数据挖掘是从大量的数据中提取隐含的、事先未知的、并且潜在有用知识的技术，是当前数据库和人工智能研究领域的热点之一。中国银行马鞍山分行数据挖掘模块使用了基于OLAP的数

学位

数据仓库数据挖掘联机分析处理决策树中国银行

钞纸中水印检测方法研究

基于工业控制与检测的生产质量管理系统,是目前工控界的研究重点,随着计算机技术、传感技术、光电技术的飞速发展,越来越多的最先进技术应用到了工控领域.建立在图像处理之上

学位

水印检测灰度修正弱对比度边缘检测

高速网络环境下入侵检测技术研究——负载均衡技术在入侵检测系统中的应用

入侵检测是一种非常重要的网络安全技术,但是随着带宽飞速发展,流量压力不断增加,传统基于网络的入侵检测系统(NIDS)面临着高速网络环境带来的挑战.采用处理机群来代替原有的

学位

入侵检测网络安全高速网络环境负载均衡

加密卡的PCI接口设计和软件实现

随着计算机技术、网络技术的发展,信息产业得到飞速发展,各种信息的保护也变得十分重要.加密卡就是采用硬件实现加解密运算的一种计算机板卡.加密卡中除了加密算法的选择和硬

学位

PCI总线密码信息安全

110接报警情地图分析系统的设计与开发

本论文所研究的"110接报警情地图分析系统"既是GIS技术与公安系统具体应用的很好结合.该系统的建成,不仅为海淀区乃至北京市公安系统在综合采用现代技术和科技新发展、提高管

学位

地理信息系统接报警情地图分析地址定位

基因比对算法在可重构平台上加速方法的研究与实验

其他学术论文