论文部分内容阅读
随着通讯技术的发展和Internet的普及,网络与人们的工作、生活联系越来越紧密,使用搜索引擎从网络中获取需要的信息已经成为了人们的一种习惯。但随着信息量的增大和行为方式的增多,传统的搜索模式逐渐暴露出许多问题,如:忠实表达问题和机械式匹配问题等。造成这些问题的本质原因是传统搜索引擎不能对用户输入的关健字进行词意分析和扩展,缺乏知识处理能力和理解能力。基于本体的智能搜索模型ISMBDI利用语义Web和本体的相关理论技术,把信息检索从基于关键词层面提高到了基于知识(或概念)层面,有效地解决了上述问题,但ISMBDI模型存在着用户查询界面不够友好、查询结果的处理方式不够人性化、查询效率较低等不足。本文针对ISMBDI模型中存在的问题,以提高系统性能和实用性、使其能够成为适于语义Web上信息共享的公共应用系统模型为目的,利用语义Web、本体和缓存等理论技术进行了相关方面的优化研究。研究内容包括基于概念的用户查询界面的优化、查询结果处理方式的优化和查询处理过程及算法的优化等几个方面。基于统一语义及用户界面友好性的考虑,针对ISMBDI模型中用户查询界面的缺点,设计了一种新的基于概念的用户查询界面。该界面综合了传统查询界面模式的优点和ISMBDI模型中用户查询界面的长处,既缩短了用户建立查询请求的时间,减轻了用户负担,又保证了语义的统一性。在深入分析了ISMBDI模型查询处理过程的基础上,提出了一个查询结果处理方式的优化策略。该策略有效地解决了ISMBDI系统在无百分之百匹配结果时出现的零结果问题,提高了系统的可用性。同时,为了实现该优化策略,提出了一种基于本体的查询请求与查询结果相似度的计算方法。该方法通过匹配成功的模式路径数目与查询请求所包含的模式路径总数之间的运算,为用户提供了查询结果与查询请求相似程度的参考值。为了减轻网络负载、减少系统的响应时间,建立了ISMBDI模型的缓存机制,并提出了一种新的缓存置换策略LRAFU。该策略综合了经典缓存置换算法LRU(最近最少使用)和LFU(最低使用频度)的优点,既避免了缓存污染问题,又适合ISMBDI模型的特点,保证了较高的缓存命中率和利用率。根据查询结果处理方式的优化策略和利用缓存中历史查询回答当前查询的思想,对ISMBDI模型中的关键算法——查询计划生成算法Qplan及其优化算法Qplan_opt进行了改进,使得改进后的算法Qplan_imp具有更加丰富的功能和更快的运算速度。在缓存机制的基础上,提出了一个快速检索机制。该机制充分利用缓存中的历史查询记录,以查全率为代价,极大地缩短了查询时间,提高了查询效率,为查全率要求不高的查询请求提供了一个快速通道。最后,我们对查询处理的关键算法Qplan、原优化算法Qplan opt、改进算法Qplan_imp、快速检索算法Qplan_quick以及缓存置换算法LRAFU进行了实验和分析,验证了本文对ISMBDI系统性能的优化效果。