论文部分内容阅读
随着人类基因测序技术的快速发展,单核苷酸多态性(SNP,Single Nucleotide Polymorphism)在遗传学研究中扮演着重要作用。研究机构在这一研究领域积累了大量的实验数据,如何从海量数据中获取有用信息并实现数据共享是目前亟待解决的问题。数据库作为数据库系统的核心和基础,其性能一直受到业界的普遍关注,数据库性能优化对系统正常运行非常重要。本文主要是对基于Web的人类SNP数据库查询系统的建设和优化进行研究分析,实现SNP数据的查询和数据库性能优化目标。构建基于SQL Server的二级生物信息学数据库HuSNP的工作主要包括数据库设计、SNP数据下载整合和数据存储三方面。SNP数据全部来源于NCBI的GenBank,下载的原始数据全部存储到本地数据库中。本系统采用Windows环境下比较流行的开发框架,IIS+ASP+SQL Server结合开发Web服务器程序,使用了B/S结构。针对数据库的性能优化问题,本文概述了性能优化的概念、优化目标、优化策略和优化步骤。数据库性能的优化涉及到多个方面,本文将应用的优化、操作系统的优化和硬件的优化问题作为主要研究内容进行展开。总结了SQL语句优化方法,索引的创建以及存储过程的使用,并进行详细分析。本文检索了HuSNP数据库的部分数据并给出注释,实现了预期的数据检索要求;最后对探索出的系统性能总体调整策略,使用Load Runner对数据库优化结果进行测试,优化前后性能指标进行比对,系统响应时间明显缩短,达到预期目标。利用HuSNP数据库能够快速查询SNP数据,为该领域科研人员SNP数据的共享提供了基础的信息服务平台。