论文部分内容阅读
数据挖掘(data mining)是知识发现(knowledge discovery in database,KDD)的核心技术。其能对数据进行存储、传输、检索及分类显示,从大量抽象数据中发现一些新的信息,更注重对多维数据以及数据间的联系和变化规则进行高层次分析,帮助使用者透过庞大的多维数据和语义关联了解其内部隐含的知识内容和关系。基因组测序(genome sequencing)是目前科学研究的热点,英国的《自然》(Nature)和美国的《科学》杂志(Science)在2011年度科研热点预测中分别将"基因组测序大爆发"(genome-sequencing explosion)和"适应基因"(adaptation genes)列入全世界科学界关注的焦点之一。本文运用文本数据挖掘技术对基因组测序的相关文献进行分析,揭示该领域的研究现状、学术前沿和发展趋势,为医学科研和卫生管理决策提供有价值的信息。