基于本体的智能搜索引擎模型ISMBDI的优化研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:anweiban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通讯技术的发展和Internet的普及,网络与人们的工作、生活联系越来越紧密,使用搜索引擎从网络中获取需要的信息已经成为了人们的一种习惯。但随着信息量的增大和行为方式的增多,传统的搜索模式逐渐暴露出许多问题,如:忠实表达问题和机械式匹配问题等。造成这些问题的本质原因是传统搜索引擎不能对用户输入的关健字进行词意分析和扩展,缺乏知识处理能力和理解能力。基于本体的智能搜索模型ISMBDI利用语义Web和本体的相关理论技术,把信息检索从基于关键词层面提高到了基于知识(或概念)层面,有效地解决了上述问题,但ISMBDI模型存在着用户查询界面不够友好、查询结果的处理方式不够人性化、查询效率较低等不足。本文针对ISMBDI模型中存在的问题,以提高系统性能和实用性、使其能够成为适于语义Web上信息共享的公共应用系统模型为目的,利用语义Web、本体和缓存等理论技术进行了相关方面的优化研究。研究内容包括基于概念的用户查询界面的优化、查询结果处理方式的优化和查询处理过程及算法的优化等几个方面。基于统一语义及用户界面友好性的考虑,针对ISMBDI模型中用户查询界面的缺点,设计了一种新的基于概念的用户查询界面。该界面综合了传统查询界面模式的优点和ISMBDI模型中用户查询界面的长处,既缩短了用户建立查询请求的时间,减轻了用户负担,又保证了语义的统一性。在深入分析了ISMBDI模型查询处理过程的基础上,提出了一个查询结果处理方式的优化策略。该策略有效地解决了ISMBDI系统在无百分之百匹配结果时出现的零结果问题,提高了系统的可用性。同时,为了实现该优化策略,提出了一种基于本体的查询请求与查询结果相似度的计算方法。该方法通过匹配成功的模式路径数目与查询请求所包含的模式路径总数之间的运算,为用户提供了查询结果与查询请求相似程度的参考值。为了减轻网络负载、减少系统的响应时间,建立了ISMBDI模型的缓存机制,并提出了一种新的缓存置换策略LRAFU。该策略综合了经典缓存置换算法LRU(最近最少使用)和LFU(最低使用频度)的优点,既避免了缓存污染问题,又适合ISMBDI模型的特点,保证了较高的缓存命中率和利用率。根据查询结果处理方式的优化策略和利用缓存中历史查询回答当前查询的思想,对ISMBDI模型中的关键算法——查询计划生成算法Qplan及其优化算法Qplan_opt进行了改进,使得改进后的算法Qplan_imp具有更加丰富的功能和更快的运算速度。在缓存机制的基础上,提出了一个快速检索机制。该机制充分利用缓存中的历史查询记录,以查全率为代价,极大地缩短了查询时间,提高了查询效率,为查全率要求不高的查询请求提供了一个快速通道。最后,我们对查询处理的关键算法Qplan、原优化算法Qplan opt、改进算法Qplan_imp、快速检索算法Qplan_quick以及缓存置换算法LRAFU进行了实验和分析,验证了本文对ISMBDI系统性能的优化效果。
其他文献
Internet的开放性使其得到了广泛的应用,但同时也带来了很多问题,每一个终端都有可能成为被攻击者,由此引起的DDOS攻击广泛的存在于Internet中,其本质是向受害主机发送大量的数据
随着通信技术的迅速发展,网络以及通信协议日益复杂。实际的网络是由多个网络设备组建而成的。作为网络的核心,路由设备和运行在其上的路由协议实现的正确性对网络性能起着举足
随着软件规模变得越来越大,自动化测试的效率也越来越重要。在软件测试领域,有大量的测试用例需要执行,每条用例对应的执行代码的逻辑结构可能不尽相同,如果每条用例的代码都手动
云计算技术已经成为了计算机技术中最引人注目的话题。根据调查显示云计算产业年增长率超过26%。然而伴随着云计算中心的规模不断扩大,现今云计算中心自身的问题也逐渐凸显出
选播是一种新的网络服务体系,它可以有效解决网络流量分布不均而导致的网络拥塞,较好的分摊网络负载,使网络资源得到合理利用。选播虽然在均衡网络负载方面有其特有的优势,但是它
传统能源日益枯竭,利用新能源的技术又不成熟;人们的环保意识日益增强,节能是环保的一个方面;我国的企业在同等产值上的能耗远远高于世界平均水平。在这样的背景下,研究节能技术显
电动机的调速是随着电力电子技术及微处理控制技术的发展而发展起来的。电力半导体器件及电子电容器件是电力电子技术的集中体现。在电机的PWM变频调速、矢量控制变频调速。
授权代理是访问控制模型十分重要的组成部分,本文在深入研究几种现有权限委托代理模型的基础上,利用RBAC自身管理RBAC的思想,在PBDM模型的基础上提出了一种新的具有自我管理
随着网络教学资源的急剧增加,传统基于关键字的教学资源检索由于缺少在语义层面上的处理和表示,这就造成了检索结果的不全面和不准确性等问题,不能满足用户对于网络资源检索的需
社会网络分析(SNA)是数据挖掘研究领域的一个热点,受到越来越多研究学者的关注,而社区挖掘是社会网络分析的一个主要研究方向。当前大部分的社区挖掘算法都假定网络中仅存在一