基于Ontology的跨媒体检索技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wangjuhui19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的发展,Web上可以共享的多媒体资源数量和种类急剧增加,基于跨媒体检索技术对用户提供多媒体信息的查询服务是近年来信息检索方面的研究热点。   跨媒体信息检索技术是指在现有的基于内容的单种类型媒体信息检索技术的基础上,建立不同类型媒体之间的相关性,在检索中返回和检索请求媒体类型不同的检索结果,从而提高用户获取信息的效率。由于跨媒体检索需要面对不同模态的媒体对象,不同模态媒体在低层特征上存在异构性,所以不同模态媒体之间关系的建立以及相似度的计算等问题是跨媒体检索的关键技术问题。在充分分析现有研究思路的基础上,本文提出了一种新的研究思路:利用Ontology来组织各种媒体的关联关系,实现跨媒体检索。本文围绕这一思路做了如下工作:   (1)分析了多媒体Ontology的技术现状,提出了一种基于多媒体Ontology的跨媒体检索方案。把不同类型的多媒体资源映射到ontology中的概念上,就形成了多媒体Ontology。多媒体Ontology不仅保留了ontology中概念之间的关联关系,而且应用多种媒体对概念进行多方位的描述。本文提出的基于多媒体Ontology的跨媒体检索技术,就是结合了Ontology中的概念之间的语义关联关系和概念内多模态特征来确定不同媒体文件之间的相似度,从而实现跨媒体信息检索。   (2)在多媒体Ontology的构建过程中,引入特征中心集机制提高概念的多模态特征描述精度。特征中心集依附在概念上,用于表达概念的一种表征,其特征值可通过机器学习的方式会聚样本的特征而获得。本文采用了多特征中心集的机制刻画概念的多表征特性。对于跨媒体检索来说,特征中心集机制不仅可以部分解决通过单个媒体的语义不确定性,又可以加快检索的速度。   (3)提出基于多媒体Ontology的跨媒体相似性计算方法,为跨媒体检索奠定基础。本文的相似度计算方法中,不同媒体的相似度可通过依附的概念语义来计算,从而跳过了不同媒体特征之间的异构性;对于同类型媒体,在前述机制的基础上,还需要结合低层感官特征提高检索的召回率。   基于关键技术研究成果,本文设计实现了一个基于体育领域多媒体ontology的跨媒体检索原型系统。原型系统中实现了多媒体Ontology定制、媒体特征提取、跨媒体检索等功能模块,实验结果表明本文的技术方案能实现跨媒体的信息检索功能。  
其他文献
广东地势复杂,植被类型丰富。植被四季常绿,树种分布无明显季节性和区域性规律,在南部多为混杂,遥感影像上破碎,不同类型植被光谱差异小。广东降水充沛常年云覆盖,使利用光学遥感数
随着计算机和通讯技术的发展,互联网上日益出现的海量数据以指数级别的速度不断地增加,其中大部分数据是非结构化的文本数据。如何高效地处理这些非结构化的数据,从中快速地提取
骨架是图象几何形状的一种重要拓扑描述,骨架化是图象分析与形状描述的一个重要的变换。3D图象骨架化在现实中有着广泛的应用,如3D数据的压缩、物体特征识别与跟踪、3D表面重建
二十世纪生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源。随着生物序列数据的日益增加,数据占用的存储空间日益增大。如何在有限的存储空间中存储
网络迅速发展的同时,网络安全日益受到关注。在网络安全行业内流行着这样一条80/20法则:80%的安全威胁来自网络内部。也就是说,真正的“敌人”是隐藏在内部的。木马技术作为一
面对日益激烈的市场竞争,概念设计对于降低机电产品开发的多域复杂性及提高产品的质量和创新具有重要作用。为了满足用户的真实要求及提高设计效率,如何为产品的功能需求分析提
当今社会,随着电子产品像电视、便携式摄相机和手持小配件的不断涌现,大量的多媒体信息也随之涌入社会。每分钟近100小时的视频被上传到YouTube。从这些网上资源中寻找一个感兴
由于XML正日益成为互联网上事实上的数据存储、交换、表示的标准,因此XML的数据越来越多,传统的关系型数据库由于关系模型本身的缺陷,不能很好的表示XML这种半结构化数据,并
随着信息社会的不断发展,人们对于语音识别系统的鲁棒性提出了更高的要求。现有的语音识别系统在实验室环境下的识别率能达到较优的效果,但是在面对自然语音进行识别时往往不能
项目反应理论(ItemResponseTheory,简称IRT)是一种新兴的心理与教育测试理论。项目反应理论是在分析与克服经典测试理论的局限性的基础上发展起来的,是在批评了经典测试理论的