一种高效Web数据抽取包装器的设计与实现

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:songyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web包装器是根据特定的抽取规则从特定的Web数据源执行数据抽取程序,设计Web包装器是Web信息抽取和集成的关键技术。详细阐述了一种基于预定义模式的Web包装器的设计与实现过程,并选取了几个出版社的新书发布Web页面进行了数据抽取验证和抽取结果分析,取得了较好的效果。充分体现了此Web包装器的可行性、高效性及可维护性,能够应用在基于Wrapper/Mediator方法的Web数据集成。
其他文献
把Web服务与工作流相结合,将Web服务作为工作流中的各项任务,通过Web服务的动态组合技术,建立面向动态工作流的服务组合模型。对Web服务描述进行了扩展,提出了一个基于层次结构的
随着计算机技术的不断发展,遗产软件在软件生产过程中起着越来越重要的作用。如何积极地利用好遗产软件已经成为目前软件工程中讨论的一个热门话题,国内外科研人员对重构遗产软
为了控制从巴西到中国的矿石出口海运成本,巴西淡水河符斥资180亿美元.打造了一个计划建造19艘44万载重吨超大型矿砂船、以及从STX泛洋和Berge租入16艘38万载重吨大型船的雄伟
介绍了数字签名的方法和过程,分析了OpenType矢量字库的表结构和与数字签名相关的表的内容。结合数字证书技术,应用于OpenType矢量字库上,将数字签名嵌人字库表中。给出了基于Wi