基于Web的半结构化信息抽取技术研究

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:yangnever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对信息抽取技术的发展和趋势作了一定分析,并讨论了当前半结构化信息检索领域的先进抽取技术。从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。通过建立标记树来进行网页结构分析,利用实例路径归纳学习出用户需求信息的公共路径,将效用的抽取结果提交用户,减少了用户负担,提高了查全率和查准率,为进一步满足Web信息抽取提供了一种新的高效信息抽取工具。
其他文献
构建社会主义和谐社会"概念的提出十六届四中全会通过的<中共中央关于加强党的执政能力建设的决定>提出了建设和谐社会的思想.<决定>指出:"要适应我国社会的深刻变化,把和谐
针对大型养路机械作业时可能会碰撞周围施工人员的问题,对该工况下的施工人员防碰撞技术进行了研究.一方面提出了新的定位算法,该算法先采用无线通信测距技术获得了目标到基