基于MRS的数据整合和应用开发

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:mongtianxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是当今世界非常热门的课题,近年来,人们注重对生物信息的数据整合和应用开发,使得生物学家能方便的进行生物信息研究。在和所内专家交流后发现:首先,面对庞大繁杂的生物数据,生物学家通常需要对指定生物内容在多个生物信息数据源中检索查询和数据处理,而且不同领域的科学家会定制不同的生物数据源。其次,生物学家关注可视化检索与展示,这样能够直观的帮助生物学家进行生物研究。   本课题涉及到TB级的生物信息数据,这些生物信息数据需要保持与国际最新生物信息数据的同步更新。同时,本课题在对生物信息数据进行整合的基础上,针对生物学家对生物信息检索查询的不同要求,对生物信息检索功能进行了探索研究:(1)设计并实现了基于GridFTP和lftp下载的bio-mirror生物镜像的海量数据同步更新平台,保持对国际公开的40多个生物信息常用数据库的同步更新。同时实现了对生物信息数据的底层数据处理和整合,总数据量近5T。(2)实现了基于MRS的生物数据索引系统,成功索引数据库35个,索引数据近4亿条,数据量近1.8T。(3)实现了微生物基因组可视化生物信息检索平台,该平台支持生物信息序列的可视化检索查询、物种分类树的检索查询、多生物信息数据库定制检索查询、BLAST序列搜索等功能;(4)在生物信息检索平台开发的基础上开发了针对同类生物信息平台的数据接口规范,为实验室其他生物信息平台提供数据查询服务,包括微生物基因组生物信息检索平台生物信息传输接口,中国科学院微生物研究所生物数据库日志收割接口、中国科学院生物网格计算平台数据查询接口、中国微生物与病毒主题数据库MRS查询接口。   本课题通过对生物数据整合的研究和生物数据检索平台的实现,给生物信息学家对生物的研究提供良好的数据处理服务。同时,本课题实现了从后台到网页前端的一整套数据流处理框架,为后来实验室针对生物信息数据处理等相关研究,也提供了一定的参考意义。
其他文献
自动人脸识别技术经过几十年的发展,在可控条件下已经可以达到比较理想的性能。然而,在环境变化剧烈的情况下,人脸识别的性能会急剧下降。现有的人脸识别方法通常是基于较低分辨
现有的计算智能算法主要模拟了物理化学规律及动物的社会行为,对于植物的生长模式尚未给予足够重视。由于植物对环境的适应能力较强,生长速度较慢,因此,模拟植物的生长过程为
图形处理单元(Graphics Processing Unit,GPU)从问世以来便迅速发展,并很快成为计算机系统中不可或缺的重要组成部分。目前GPU已在低端嵌入式系统、个人桌面应用、图形工作站乃
随着虚拟化技术的不断发展,虚拟机软件扮演着基础平台的角色。KVM(Kernel-based Virtual Machine)是一种基于硬件的完全虚拟化的系统仿真器,自Linux2.6.20之后,它被集成在Linux
城市三维信息的获取对城市建设、开发规划、信息服务等方便起着重大作用,且可用于三维模式识别、3D动画设计等新兴领域。计算机立体视觉是被动式测距方法中最重要的距离感知技
超龙一号系统是国家智能计算机研究开发中心提出的一种以应用为导向的技术路线。其中的算法可重构加速卡基于FPGA实现,是整个系统的一个重要组成部分,关系到整个系统的效率。而
随着计算机、通信、网络、嵌入式等技术的发展,普适计算的硬件环境和软件环境正在发生巨大变化。这种变化使得普适计算的信息空间,与人们生活和工作的物理空间逐渐融为一体。在
随着企业信息系统中的数据量飞速增长,用于实现数据缩减的重复数据删除技术日益为人们所重视。重复数据删除技术主要应用于数据备份系统和数据归档系统。由于数据归档系统需要
面部特征点定位是指在输入人脸图像上自动检测面部关键特征(如眼睛中心点,眼角点,嘴角点等)的技术,可以用于对齐待匹配的人脸图像,因而是全自动人脸识别中的关键步骤之一。此外,精
设A是一个字母表。如果语言X,Y(C)A*满足XY=YX,则称X,Y是可交换的。如果语言X,Y(C)A*满足XY(C)YX或YX(C)XY,则称X,Y是部分可交换的。目前已知:在自由半群A*上,若x,y∈A+,xy=yx,则存在t