Deep Web信息集成关键技术的研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:zjie16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万维网的迅速发展,Web中蕴藏着海量信息。研究表明,Deep Web蕴藏的信息量是Surface Web的500多倍。因此,对Deep Web中的信息进行处理并加以整合为用户所用已经成为Web信息检索领域的一个新兴研究热点。本文介绍了Deep Web信息集成领域的研究背景、研究现状,对Deep Web信息集成的几项关键技术进行了研究。首先对聚焦爬虫进行改进,设计一个基于主题的查询接口发现聚焦爬虫对Deep Web中的查询接口进行发现;然后采用基于权重值计算的方法对Deep Web中查询接口进行集成,分别讨论了1:1和n:m两种匹配情况,对匹配过程中的权重值计算方法进行了改进,采用《知网》概念模型中的词语相似度计算方法对匹配过程中遇到的标签及属性名进行相似度计算,解决了一般方法无法考虑词语概念相似度的问题;最后将移动Agent技术引入到Deep Web查询处理中来,设计了一个基于移动Agent的查询处理框架,采用移动Agent技术降低了查询处理模块对带宽和网络延时的要求,同时为Deep Web分布式查询处理提供了新思路。
其他文献
水声信道多途传播效应产生的码间干扰是制约水声通信系统性能的主要原因,均衡技术是克服码间干扰行之有效的方法。传统自适应均衡技术由于要发送训练序列,通信效率较低,而盲
目前几乎所有的视频编码核心技术都是采用运动补偿加离散余弦变换编码的方式。然而基于离散余弦变换的视频编码在低码率下将产生严重的块效应,虽然后来提出的重叠块运动补偿
图像加密是保护图像安全的一种重要手段。但图像本身具有信息量大、冗余度高和相邻像素相关性高的特质,导致传统加密方式不适用于图像加密。混沌系统具有的伪随机性、不可预
随着计算机网络的普及及广泛的应用,信息安全越来越受到人们的重视。信息安全的目标是实现信息的安全性,保证数据的完整性,实现身份上的鉴别性,具有不可抵赖性,保证信息的可
随着我国铁路的大规模建设和信息化发展,GSM-R/GPRS系统承载的铁路通信业务也越来越多。近年来,中国铁路提出在GSM-R/GPRS上开展更多铁路通信业务的需求,以推动中国铁路信息
随着多媒体技术的不断发展,隐写术在信息传递过程中扮演着越来越重要的角色。隐写术主要是将信息嵌入在载体中,尽可能地通过公共信道传送出去而不引起第三方的注意,注重隐蔽
早在2003年国际电工委员会(IEC)就已表决通过了DRM标准,其数字传输技术早已成熟,目前影响其大范围推广的主要障碍就是DRM接收机的实现复杂度和成本过高。目前国外已经开发出多
本学位论文是国家"863"计划项目(批准号:2003AA1Z1110)和江苏省高新技术研究项目(批准号:BG2005001)课题的研究内容之一。首先介绍了无线传感器网络的体系结构、协议栈、特征
无线网状网络(Wireless Mesh Network)简称WMN,是一种新型的无线通信网络。无线Mesh网络具有自组织性和自愈的特点,并有有效的移动用户管理和跟踪机制,既是多跳的宽带无线网络,又
信源、信宿和信道构成了通信系统,信源是信息的发源地,信宿是信息的到达地,信源和信宿之间的通道叫做信道。对于通信系统的研究,信源和信宿都是真实可见的,但是对于信道来讲,