基于本体的Web信息抽取

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:yellue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着互联网的快速发展产生了海量的信息,Web页面呈现多样性和异构性等特点。此外,目前的Web页面结构比较复杂,在同一个页面上往往包含多个不同的主题,这也给用户的信息抽取带来了一定的麻烦。因此,用户在对Web网页进行信息检索和处理时就会受到很多的限制。Web信息抽取方法研究的目的是将Web上存在的信息转化为结构化的数据,从而为搜索引擎和数据挖掘等应用提供方便。本文通过对网页分块技术和基于本体的Web信息抽取进行分析,得出两者之间的共同点,并在基于本体的Web信息抽取中引入了网页分块技术,从而对算法进行了改进。此外,论文还对基于本体的自适应Web信息抽取平台进行了研究分析,并将该平台应用到了书籍信息的抽取中,通过实验对平台做了进一步的说明。论文的主要工作内容可以概括如下:  1、针对网页分块技术与基于本体的Web信息抽取之间具有共同之处,在基于本体的Web信息抽取中引入了网页分块技术,对算法进行了改进,并通过与改进前的算法进行了对比实验,验证了改进的算法在准确率和召回率方面都较之前有了较大的提高。  2、基于HNC理论,对Web信息抽取进行了深入的研究,主要解决了短语境环境下语境框架的抽取。  3、对基于本体的自适应Web信息抽取平台进行了研究分析并详细介绍了领域资源发现系统和实体命名关系抽取子系统,此外,本文还将该信息抽取平台应用到了书籍信息的抽取中,进一步通过实验对信息抽取平台进行了介绍。  
其他文献
突如其来的新冠肺炎病毒危机是大学生防疫教育的最好的活教材,高校应该抓住疫情防控契机,开展大学生国家意识、居家隔离生活、防疫法规、健康中国教育,用实际行动回应疫情防
[摘 要] 性行为在大学生群体中已经不再陌生,大学生性行为所带来的伦理困境不仅是理论问题,更是实践问题,需要给予重视。责任伦理为审视大学生性行为提供了新的维度,即作为善本身的目的、“应当”的责任范型、对未来负责的伦理视域。在此维度下,通过忧患启迪法及构建大学生性行为的伦理教育体系两条路径对大学生性行为的伦理困境进行探索性解决。   [關键词] 大学生性行为;责任伦理;忧患启迪法;教育体系  
突发事件频繁造成了巨大的经济损失和人员伤亡,随着GIS技术的发展和应用,将GIS技术与突发事件的应急救援相结合,可以在很大程度上提高应急救援效率。通过GIS技术,可以将多种应急
随着大数据时代的到来,每天产生海量各种非结构化和半结构化的数据,传统的存储模式与计算模式很难及时对这些数据进行存储和处理,因此,MapReduce计算框架应运而出。Hadoop作为Map
信息化建设是企业为了生存和发展必然要采取的技术途径,一个良好的、可持续发展的信息系统对于企业实现其战略规划和经营目标有着十分重要的作用。传统的开发方式中,系统分析
大图计算已成为一种基本计算模式,并被应用到许多实际应用中,如社交网络分析、网页搜索、商品推荐等。以GraphChi为代表的单机图处理系统通过优化IO访问和充分利用多核并行性等
[摘 要] 打造“双创”升级版对地方高校“双创”教育提出了更高的要求。本文基于此背景尝试寻找地方高校“双创”教育尚存在的不足,分析了问题产生的原因,提出了解决问题的实践路径:要注重师资队伍、课程体系、质量评价体系、“双创”平台的建设。   [关键词] 地方高校;创新创业教育;人才培养;革新研究;双创;升级版   [中图分类号]G642 [文献标志码] A [文章编号] 1008-2549(
“一带一路”倡议愿景与规划的实现,须以语言沟通为基础;倡议提出以来,汉语国际教育专业人才需求剧增,人才培养面临巨大机遇与挑战.应用型本科高校应以“国际化人才培养”为
应用共享是网络会议系统的主要功能,可以将会议主持者主机上的应用视图(例如PowerPoint, Word, Excel和PDF)通过网络传输分享给其他与会者,为网络会议使用者之间更好地沟通交