面向关系数据库的语义关键字搜索研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:bbschengpengfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于关键字的搜索引擎是人们在互联网上搜索信息的重要方式,而互联网上大量的关系数据库则构成了DeepWeb的主要组成部分,因此面向关系数据库的关键字搜索成为该领域学者关注的研究热点。随着研究的日益成熟,对查询关键字语义的理解成为其研究的一个方向。通过研究,本文提出面向关系数据库中查询关键字的三种基本语义(关系名语义、属性名语义和值语义)和两种潜在语义(依赖性语义和顺序性语义)。为了能将该语义渗透到查询过程中,提出面向关系数据库的语义关键字搜索模型SKS。该模型分为离线处理模块和在线处理模块两个子模块。离线处理模块主要通过现有的数据库信息和查询结果日志的记录信息为在线处理提供辅助。本部分重点介绍了关键字索引的结构和网络图的构建。对于查询关键字映射的不同,关键字索引将为其返回不同的索引结构,该方法重点体现了关键字的基本语义。网络图的构建过程以数据库模式图和查询日志为载体,以Apriori算法为基础实现,该过程体现了关键字的依赖性语义,并为候选网络的生成提供基础。在线处理模块中,本文主要介绍了候选网络的生成、查询转换和结果排序三个环节。候选网络的生成使用基于单源最优路径的候选网络生成算法来实现,该算法通过扫描网络图来找到候选网络。查询转换环节通过为关键字查询定制相应的转换模板来实现,而结果排序则以关键字的顺序性语义为基础,通过对查询结果进行聚类等操作来实现。经过实验验证,本文提出的语义关键字搜索模型SKS在面向数据库的关键字搜索中有很好的查询效果,在实验中获得了很高的查准率和召回率。同时此实验也说明了本文提出的关键字基本语义和潜在语义的正确性。
其他文献
在软件开发的过程中,需求项如果没有经过深入协商,并且没有在各涉众之间达成一致,会对后期的开发带来不必要的重复工作,导致开发成本上升,甚至项目失败。WinWin协商模型是一
互联网业务呈现出以用户为中心的融合趋势,多数机构已在管理域内实现单点登录和Web业务融合,而跨管理域的业务融合应用较少。流化业务在此背景下被提出,它是在互联网分布式计算
网络的不断发展使得信息安全成为网络应用不可缺少的技术基础,网络信息系统需要保护其真实性、保密性、完整性以及可追究性。公钥密码技术是信息安全的核心技术,它给电子商务的
随着Internet的不断发展,Web数据逐渐成为人们关注的焦点。Web上拥有着大量有价值的数据,其中Web源上的结构化数据就是其中之一。Web源上的结构化数据是指将Web源上的网页数
随着信息技术和互联网技术的高速发展,视频逐渐成为了人们获取和传递信息的一种重要媒介。视频中的文字是一种高级语义信息,能够为视频索引与检索提供十分重要的辅助信息。如
视觉真实感绘制是通过对人眼进行光学建模,以人眼模型为成像模型,对人眼的多种成像特性和视觉缺陷进行模拟成像的技术。它能够绘制反映人眼球面像差、近视和远视等视觉特性的图
带有通配符的字符串匹配问题已成为诸多领域的研究热点,例如生物信息学、数据库系统中的SQL查询、搜索引擎的文本索引、文件名查找、网络入侵检测等领域。然而,带有通配符的
伴随着信息技术的迅速发展,网络信息量以指数级增长,以及网络信息检索工具效率低下,使用户很难从网上检索到所需信息。在本人参与的科技信息资源中心系统中,由于科技信息资源数据
随着世界各国在空间探测领域内的深入研究和扩展实验,空间探测领域使用的计算机系统所需完成的任务越来越复杂。但在空间环境中,由于空间辐射的影响,计算机系统很容易发生硬件故
具有真实感的语音可视化合成技术一直是多媒体和人机交互领域的一个有趣而具有挑战性的研究方向。它可以广泛地应用于教学、数字娱乐、远程会议以及电影游戏等方面。   本