流感病毒数据库IVDB的构建及流感序列分析研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:ynhz009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流感是人类历史上最重要的流行病之一,给人类牛命健康带来了很大的灾难,尤其2003年以来高致病性禽流感H5N1的频繁爆发使得流感病毒的研究再次成为热点.流感测序序列日益增加,已经有三万多条序列完成测序,构建可用于比较分析的专业流感病毒数据库已经成为必需.在此基础上,我们构建了流感病毒数据库IVDB,它整合了所有公共数据库中的数据、信息,并整合开发了一系列工具,使其成为流感病毒遗传、基因组、系统进化等分析的平台. IVDB包含了北京基因组研究所测序的流感全基因组数据,同时还收集、整理、注释公共数据库中的流感病毒序列数据,通过我们开发的质量过滤系统 O-Filter根据核酸序列的内容及其完整性对序列进行分类与整理.IVDB还提供了一系列工具和可视化视图用于病毒基囚组的进化分析、遗传多态性分析及进化分析:开发的搜索系统可以使用户通过设定各种组合选项得到自己所需数据;为方便全球病毒传播、流行趋势及进化分析的研究,我们开发了流感序列分布工具IVDT用于展示用户所选数据的地区分布;提供比较分析工具BLAST、多序列比对工具及构建系统进化树工具的在线使用;同时,IVDB还提供了我们分析的核酸及蛋白序列多态性分析数据,包括SNP分布图及次等位基因分布图.流感病毒数据库IVDB的文章已经在2007年1月份的核酸研究数据库专刊上公开发表. 在构建的IVDB基础上,我们又将在流感病毒序列突变导致蛋白结构改变的预测与模拟、流感蛋白与人或其他寄主之间的蛋白相互关系、流感抗原识别位点epitope预测等方面展开进一步分析.
其他文献
当今的社会是个信息和科技非常发达的社会,随着信息化建设的不断发展,各行各业都有大量的数据被存储在各种数据仓库中,而且数据量每天都在不断以惊人的速度增加,数据种类繁多,如何
目前随着互联网技术的发展,人们被迫面对海量的信息,如何能够有效的利用这些信息成为了信息领域新的研究热点。如何对这些信息进行有机地整合,生成有结构的知识,为知识的学习者和
部件化网络内存是网格化动态自组织体系结构(DSAG)研究的一个重要的部分.单纯的软件原型或硬件原型系统分别在系统性能、稳定性、可扩展性、开发周期等方面存在不足.随着对网
随着半导体工艺技术的不断进步,芯片的设计规模越来越大,特别是进入深亚微米以后,集成电路完全可以将一个完整的电子系统在单块芯片上实现,于是便出现了片上系统(System on C
随着集成电路工艺特征尺寸的不断减小,以及大型计算机和消费类电子产品对于高性能和低功耗的不断需求,超大规模集成电路(VLSI)设计向着高速、低功耗的方向努力.这种情况下,芯
资源空间模型是知识网格理论的核心模型之一,用于规范、管理和共享资源,是一种基于分类语义的数据模型.资源使用机制是主要阐述如何在资源空间中管理和使用资源的机制. 本
学位
消防监督检查是指各级消防监督机构依法对建筑物遵守消防法律、法规情况进行的监督检查,对违反消防法律、法规的行为,责令改正,并依法实施处罚.通过消防监督检查,消防监督机
由于存储器和处理器速度差距的日益增大,访存延迟已经成为限制程序性能的主要瓶颈.数据预取通过提前将数据取入缓存,可以掩盖访存延迟,对于提高程序性能有很大的帮助.本文以O
数值型数据是信息领域中非常重要的数据,广泛应用于商业经济、地理环境、社会资源以及科学实验等各个领域。科学数据库广泛存在数值型数据,主要集中在中国自然资源数据库,覆盖水
学位