一种基于DB&IR的融合查询机制的研究与实现

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:kongguoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展和企业信息化程度的提高,越来越多的信息被存储在数据库中并供用户查询。但是传统的数据库系统是面向程序员和高级用户的,用户需要熟悉复杂的查询语句并且了解数据库的模式才能查询信息,这对一般用户而言比较困难。同时,由于数据库查询缺少对相关性排序的支持,用户难以有效地从成千上万的查询结果中发现所需要的信息。而信息检索中的相关技术能够解决目前数据库查询中存在的这些不足,因此如何将数据库技术与信息检索技术融合起来,为这些面向用户的数据库提供高效且易于使用的检索功能,成为一个普遍的需求。而数据库的关键词检索系统正是这种需求下的一个产物。本文首先介绍两类主要的数据库关键词检索算法:数据图算法和模式图算法,然后对这两类算法进行比较。由于模式图算法不需要维持数据库中所有元组构成的关系图,具有较小的系统开销。同时,当数据库的内容发生变化时,模式图检索算法能够更加快速地适应这些变化,并在检索结果中加以体现。因此,基于模式图的检索算法是目前数据库关键词检索研究的热点之一。但是,现有的模式图算法仍然存在着检索效率低下,查询准确率不高等问题。为了解决这些问题,本文对现有算法进行改进,改进后的算法包括以下四个部分:数据库预处理、精简查询模式构造、候选网络生成和候选网络执行。其中,数据库预处理是指根据数据库包含的关键词,生成预设查询模式以及对应的元候选网络,同时根据不同的更新条件,对元候选网络进行更新。精简查询模式构造是对用户输入的关键词进行组合,去除重复出现的元组,构造精简查询模式,通过这种方法有效地降低了元组集的规模。候选网络生成时,首先匹配用户的查询模式与预设查询模式,如果匹配成功,则选取预设模式对应的候选网络,如果匹配失败,则根据查询模式与数据库模式图动态生成候选网络。候选网络执行时,本文选取余弦向量公式来计算元组连接树与查询的相似度,并据此设计一个优化的元组连接树生成算法,同时还对SQL语句的生成与执行进行优化,进一步提高系统检索的效率。在前文改进算法研究的基础上,本文设计并实现一个基于改进算法的系统,与使用现有检索算法的系统进行比较。实验使用两个规模的数据集,通过对比使用不同优化算法的系统检索耗时来分析改进算法对系统检索效率的影响,并引入信息检索中的平均准确率与召回率来评价系统的检索性能。实验表明,使用改进算法的系统具有更高的检索性能和检索效率。
其他文献
微粒群算法是一种模拟鸟群飞行、鱼群游动的群体智能算法。该算法简单易实现、可调参数少,已成功应用于许多领域。论文从动物觅食原理出发,对微粒群算法的算法结构进行了改进
本课题主要是分析高中化学导学案教学,研究小组合作的实施以及对教学方式的反思和建议,从而有效地提高教学效果.随着我国综合国力的提高,各行各业也在不断的发展,特别是教育
在新课改理念下,对化学实验的安全性要求越来越高.文章从发展微型实验、规范化学实验操作、改进化学实验装置、多媒体模拟危害实验四个方面进行阐述,旨在倡导绿色化学理念的
软件测试已经变得比以往任何时候都复杂和困难。软件测试作为保证软件质量和可靠性的重要手段己经成为国内外软件行业研究的重点方向之一。研究测试用例的自动生成,可以降低
近几年来通信技术飞速发展,人们对手机质量的要求越来越高。GSM/GPRS手机的监督检测成为一个重要的环节。本文主要研究的是GSM/GPRS手机自动测试系统的分析与实现。文中简单
在科技飞速发展的今天,提高学生的科学素养势在必行.在《新课程标准》中,北师大郁波教授就从三个层面对科学素养进行了阐述,一是扎实的基础知识;二是科学的思维方式;三是科学
普通高中生物新课程的教学改革开展以来,从传统的生物课堂到新课程理念下生物课堂的不断转变中,作为一名生物教师的角色转变,成长转变,自我需求转变,都慢慢变得清晰,尤其在最
目的比较薄层液基细胞学(Thinprep liquid cytologic test,TCT)单独及联合人乳头状瘤病毒(human papillomaviruses,HPV)-DNA检测在宫颈癌及宫颈早期病变筛查中的价值。方法宫
随着电子技术、计算机技术、通信技术的迅速发展,传统的人工抄表方式已经不合时宜,运用现代化网络技术来进行远程抄表已将成为一种趋势。远程抄表系统采用两层通信信道、三层
生物科学史是生物科学知识发展与生物研究方法演进的过程,其中蕴含着丰富的教育价值.随着我国教育改革的进一步推进,将生物科学史的教学渗透到高中生物课程中有着极为重要的