政务信息资源目录服务检索技术的研究与实现

被引量 : 4次 | 上传用户:tang790330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子政务的发展,各政府部门纷纷建立了独立的电子政务系统。由于这些系统缺乏统一标准,不同部门对政务信息资源基于不同的规则进行采集和整理,因此产生了“信息孤岛”现象。为了减少资源的重复采集和多方建设,实现政府部门间业务高效协同和信息共享,需要为社会公众提供“一站式”政务信息资源服务。政务信息资源目录服务体系通过国家标准,对资源进行分类和编码,通过目录共享和交换体系形成各种政府资源共享与关联机制。统一目录的建立可打破政府部门间“各自为营”的局面,实现资源的“全流通和全共享”。本文对政务信息资源利用的国内建设情况进行总结,提出了基于元数据管理的电子政务信息资源目录服务系统模型,包括共享信息服务系统、编目系统、目录注册系统、目录管理系统五个组成部分,并设计基于混合检索模式(分类检索、高级检索和关键字检索)的目录服务检索模型,为不同用户提供高效便捷的检索服务。在政务信息资源目录服务检索模型中,关键字检索方式相对于Xquery等结构化查询语言而言,不需要用户学习复杂的查询语言,也不需要对XML文档底层的数据结构有深入的了解,用户仅需输入感兴趣的关键字就可完成查询。现有的主流XML关键字查询方法通常只考虑节点间的空间结构信息,以包含关键字匹配节点的片段作为查询结果,而忽视了节点间的语义相关性,因此导致返回结果中普遍含有大量与语义无关的冗余信息。本文以《政务信息资源目录体系》国家标准中的核心元数据规范为依据,在分析核心元数据及其特殊性后,提出了一种基于语义相关度排序的政务信息资源检索算法RF-MT。该算法将政务信息资源XML元数据的TF+IDF、关键词依赖度等作为语义相关度衡量因素,通过语义相关度打分算法对检索结果集进行语义相关度排序。为了提高检索效率,通过改进原有的关键词倒排索引结构来提高检索效率。实验表明该算法在检索结果排序精确度和时间效率上均有较大改善,可有效提高政务信息资源利用的数据共享服务能力。最后,分别介绍了三种检索模式的实现方法,并将RF-MT算法运用到混合检索模式中,实现了基于语义相关度排序的目录服务检索系统的应用。
其他文献
<正>随着认识的不断深入,目前恶性肿瘤的治疗已不仅局限于手术治疗,以手术为主的综合治疗形成了多个相关专业共同参与的多学科诊疗模式[1]。多学科诊疗模式不仅局限在恶性肿
本文在翻阅大量文献资料的基础上 ,分析了 1990年代以来国外商业地理研究进展 ,总结出国外商业地理研究的 9个主要研究方向 ,以期对中国的商业地理学研究和商业发展有所借鉴
目的探索个体化乳腺癌放疗体位固定技术的改进方法。方法乳腺癌患者40例,A组(20例)采用乳腺托架固定,B组(20例)采用真空袋、直肠癌体架和热塑体膜联合固定法固定。利用EPID拍
目的观察UPDRS评分、Hoehn-Yahr评分、PDQ-39评分、Schwab-England评分的拟合度。方法选取2006.1-2008.12海军总医院神经外科收治的帕金森患者21例,男15例,女6例,平均年龄57.
《外婆的日用家当》是沃克利用三位女性的人物形象,充分分析了当时发生在美国社会中的黑人权力运动情况。文章通过对这部作品中三个女性人物形象的分析,揭露了那场运动中黑人
目的探讨H型高血压与早期肾损害的相关性。方法将符合入选标准的原发性高血压患者123例,根据血同型半胱氨酸(Hcy)水平的不同分为H型高血压组和单纯高血压组,分别测定血清Hcy
<正>1危急值的概念和意义危急值(critical value;panic value)是指某一临床检验结果与正常参考范围偏离较大,表明患者可能处于生命危急状态而必须立即给予治疗的临床预警值。
现在多媒体、网络信息不再是新名词、新事物,已经成为人们工作生活中不可缺少的一部分,离开多媒体和网络就到了寸步难行的地步。微课的诞生就是基于多媒体的广泛应用,其丰富
目的:探讨他汀类药物不良反应的发生规律。方法:收集1998~2008年发表的他汀药物不良反应,按设定的标准进行统计分析。结果:10年间符合标准的77篇文献中报告他汀类药物所致不良