【摘 要】
                                :
                                Web上的信息根据深度可以划分为两大类:Deep Web和Surface Web。Deep Web中的信息比Surface Web中的信息质量更高、信息量更大,为了有效地利用这些信息,需要建立Deep Web数据
                              
  
                             
                           
                                                       
						    
                            
                        
                        
                            
                                论文部分内容阅读
                            
                            
                                Web上的信息根据深度可以划分为两大类:Deep Web和Surface Web。Deep Web中的信息比Surface Web中的信息质量更高、信息量更大,为了有效地利用这些信息,需要建立Deep Web数据集成系统,而查询接口集成则是Deep Web数据集成的关键步骤。本文主要针对中文图书领域Deep Web数据集成中的查询接口集成进行研究。英文领域的接口集成方法很难有效地应用到中文领域,而中文领域的接口集成方法也存在着集成的属性类型不够全面和匹配准确率较低等一些不足之处。本文针对以上问题对接口集成方法进行了深入研究,首先根据Deep Web接口的结构将查询接口分为4类,然后给出了接口的形式化表示,在此基础上提出了基于关键字、本体和中文语义相似度计算对属性进行匹配的方法。该方法首先对待匹配的属性进行关键字匹配,接着对没有匹配到的属性应用本体进行匹配,然后对于前两个步骤都没有匹配到的属性应用改进的语义相似度计算进行匹配,最后把匹配成功的属性集成在一起构成最终的统一查询接口并进行相应的查询映射。该方法应用于中文图书领域的接口集成,集成的属性较为全面,对结构化、半结构化、无结构化和可转换的混合型查询接口都适用。实验结果表明该方法具有较高的匹配准确率。
                            
                        
                        
                        
                            其他文献
        
 
                            
                                
                                
                                    Ad Hoc网络具有无中心、自组织、多跳路由等特点,这使得它很好的适用于一些特殊的地理环境,像地震,台风过后的地区。也正是这些特点使得Ad Hoc网络的分群变得很独特。分群的                                
                                
                             
							 
                            
                                
                                
                                    Cayley图是由有限群导出的一类重要的高对称正则图,被认为是非常合适的互连网络拓扑结构。很多优秀的互连网络如双环网,超立方体,星图都是Cayley图大家知道对Cayley图的研究起步                                
                                
                             
							 
                            
                                
                                
                                    以尽量少的比特数目表征图像特征,并且在图像解码时能够保证图像的质量,使它能够满足特定的应用场合,这是图像压缩编码的主要目的。分形图像压缩是近几年发展起来的新型图像                                
                                
                             
							 
                            
                                
                                
                                    对于用户而言普适计算环境不再是一台固定的电脑,而是一个包含多种异构设备并且可以根据用户状态动态改变的计算空间。普适计算环境下利用合适的方法管理该计算空间可以很好                                
                                
                             
							 
                            
                                
                                
                                    近年来,随着传感器技术和数据库技术的迅猛发展,数据挖掘技术得到了广泛的应用,影响着人们生活的各个领域。数据挖掘技术就是从海量的、有噪声的数据集中提取新颖的、有价值                                
                                
                             
							 
                            
                                
                                
                                    自20世纪80年代末出以来,GUI广泛应用在各种软件系统中,如电脑操作平台、手机软件系统以及互联网站等。GUI已经成为现代软件中实现交互的一种重要方式,因此GUI测试也成为系统测                                
                                
                             
							 
                            
                                
                                
                                    随着经济社会的发展,人们对于旅游的需求越来越旺盛,旅游产业迎来了快速发展。各种旅游信息呈爆发式增长,如何方便快捷的从这些信息中获取有用信息变得越来越困难。当人们将                                
                                
                             
							 
                            
                                
                                
                                    为了有效地利用Deep Web中丰富的、高质量的信息资源,建立Deep Web数据集成系统成为当前研究的迫切需求。Deep Web接口的发现与抽取是构成集成系统的基础,占有重要的地位。本                                
                                
                             
							 
                            
                                
                                
                                    随着软件的在关键领域如电子商务、银行、航空等的广泛应用,其可信性已经越来越多的获得人们的关注,据报道,2000年到2006年基于WEB的攻击从25%上涨到61%。然而,目前的软件工                                
                                
                             
							 
                            
                                
                                
                                    笔者硕士论文的研究工作是在对路由器(交换机)和通信子网进行性能测试与评价的背景下进行的,本论文涉及分布式协同多点并发测试系统的图形化描述工具。ISO9646为测试网络中继