构建Web数据空间的若干关键技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:hanjian8706
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,Web已经成为一个巨大的信息宝库,拥有海量的数据,成为人们日常生活、电子政务和电子商务等领域不可或缺的部分。为了有效的利用Web上的数据资源,目前已经有很多专门用于Web数据处理的方法:Web数据挖掘、Deep Web数据集成、利用语义技术重构Web而建立的语义Web等。数据空间是针对新的数据特点和数据管理技术的抽象与概括,其本质是解决数据集成问题。数据空间是一个实体所拥有的所有数据的集合。Web数据空间系统是通过集成演化的构建方法,为实现用户所关心的Web上数据访问而建设的一个可持续改进的与可逐渐实现Web语义集成的Web数据集成系统。建设Web数据空间系统的目的是为个人或组织有效地利用Web数据提供一种解决方案。围绕如何构建一个Web数据空间需要解决的关键问题:系统框架、数据模型、数据源选择、模式集成、访问控制等方面开展了研究工作,具体的研究成果如下:(1)提出了Web数据空间的系统框架与构建原则。在数据空间数据集成理念的基础上,结合Web数据的特点,分析了Web数据空间的一些主要特征,给出了构建一个Web数据空间系统的一些基本原则:能够管理Web上的所有数据、使用集成演化数据构建原则、充分利用现有技术、利用协作方式、便利的数据分享方式等。设计了Web数据空间的系统框架,给出了各部分的详细功能,最后详细的讨论了使用显式反馈与隐式反馈实现Web系统空间进化的一些问题。(2)设计了Web数据空间系统的数据模型。基于RDF模型,设计完成了Web数据空间数据模型。模型首先通过RDF建立了一个数据视图,该视图实现了Web上所有数据的统一表示。具体应用时需要针对具体类型的数据进行实例化,具体的实例化模型包括:网页数据、文件&文件夹、Deep Web、数据流、关联数据等。该模型可以实现Web上所有数据的统一建模,在单一模型内部实现非结构化、结构化以及结构化数据的统一表示与访问。(3)提出了一种基于用户查询与数据源中间模式关联度、数据源数据质量、数据源最小查询代价综合考量的Web数据源选择方法。该方法分为两个阶段:第一个阶段根据查询与数据源的关联度、数据源质量选择数据源;第二个阶段使用最小查询代价模型动态选择第一阶段已经选择的数据源,满足用户k个查询记录的需求。在最小查询代价模型算法的设计中,使用了最大熵模型计算数据源之间的重复度。(4)提出了一个Web数据空间数据模式集成与映射方法。首先给出了Web数据空间模式集成的框架,然后运用组合的方法,基于K-中心点算法实现了中间模式的自动集成,最后提出了使用Top-k个模式与用户查询进行映射与匹配的方法,提高了用户查询的准确率与召回率,同时给出了使用集成演化的方法提高查询精度的方法。(5)设计了一个细粒度的基于上下文的访问控制模型。基于XACML模型,运用目前的一些语义技术:使用OWL描述主体、客体、操作与环境,使用SWRL实现语义推理,设计完成了一个细粒度的可以实现对关联数据数据空间的访问控制模型。模型中使用语义范围方法大大减少了访问规则的定义,相关语义技术的使用可以实现对数据空间数据上下文的访问控制。
其他文献
实际应用系统在设计和运行等各个阶段都面临着需求变更的问题,尽管可以通过对既有系统进行改进或替换来应对,但往往会耗费用户非常大的人力和财力。为了实现对既有系统的良好
期刊
利用数据中心的高性能软硬件资源,云计算能够以“所付即所用”的方式对用户提供高质量和高可靠的服务,这种“以服务的形式提供计算资源”的新型模式已经在很多领域得到了广泛
目的为临产妇和产科医生提供一种无创、方便、客观、准确的宫口开大测量装置。方法通过两个柔性测量指环和位于两个测量指环间的测量尺完成宫口测量,测量方法符合临床常规宫
杭州产茶历史悠久,唐代陆羽<茶经>中已有杭州产茶的记载.鸦片战争以后,帝国主义的炮舰外交使上海成为通商口岸,我国茶叶外贸的口岸由广州移到了十里洋场的上海.由于沪杭交通
系统介绍了福建三钢5号高炉大修情况,总结了两代炉役的设计上的主要区别及第二代炉役改进的主要工艺措施,并详细阐述了高炉本体最新先进性工艺技术,各项措施投产取得良好效果
变是市场经济中的常量5月28日,合肥市稻香楼宾馆宾客盈门,新老朋友汇聚一堂,这里正隆重举行中国建材集团合肥水泥研究设计院50年庆典活动.
针对物理化学实验中传统的希托夫法测定离子迁移数的实验设计易出现时间久,实验结果不准确的特点,对实验方案进行了改进。采用操作速度快、准确率更高的电导滴定法代替实验中
目前利用生物法处理印染废水应用非常广泛。激活剂作为能提高生物酶活性、促进酶促反应、提高生物降解效率的有效物质,在提高含染料废水生物处理效率的研究中具有重要意义。