基于多模态共振和共生的多模态数据分析及应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:nnlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体文档是指音频、图像、文本、视频(连续图像帧)等组合模态数据的总称。音频、图像、文本和视频(连续的图像帧,不含音频)各自有不同的侧重点,音频侧重听觉方面的信息,图像和视频侧重表达了视觉方面的信息,文本侧重表达了文字方面的信息。此四类模态虽有各自的不同表达侧重点,但是都表达了丰富的语义信息。为了更好的分析多媒体文档包含的语义信息,需要充分挖掘各模态数据之间的互补性和相关性,因此研究多模态数据关联势在必行且有十分广泛的应用意义。由于相异模态表达侧重点不同,给多模态数据的分析带来了一定的困难,主要包括:1、如何确立关联,即哪些物体之间存在关联;2、如何衡量关联尺度,即确定物体之间关联的量。由于各模态数据之间存在特征表现形式不同、存在异构性,表现出底层特征提取方法不同、特征维数不同和属性不同,彼此之间无法直接进行多模态数据关联计算,直接导致各模态数据之间虽内容关联但存在不可比性。多模态数据之间的内容特征异构性和不可比性,会进一步导致底层特征和高层语义之间存在所谓的“语义鸿沟”,因此增加了多模态媒体数据分析的难度。本文对多模态数据关联方法进行了深入研究,着重围绕电影媒体中的音视频关联分析,以及网页中的多模态数据关联分析展开。我们首先针对电影数据进行关联帧检测,通过对电影的视觉部分和音频部分分别建立视频关注度曲线和音频关注度曲线,建立音频关注度曲线和视觉关注度曲线,并根据关注度曲线关系检测出多模态数据的最大关联。其次,考虑到网页包含文本、图片、音频和视频等典型模态,我们对网页中的多模态数据的共生(co-occurrence)关系进行了探索,并利用多模态网页的共生关系建立多模态关联,进而应用这种多模态关联关系对网页元素进行关联传播,来实现相似网页的自动推荐。实验证明,本文中的方法可以有效地进行多模态数据关联度分析及应用。
其他文献
应用服务器的研究工作采用了将软件组件技术和分布式对象技术相结合的思想.通过软件组件方式增强系统的可用性和灵活性、提高软件重复利用率;分布式对象技术为应用服务器提供
水利工程中输水渡槽多采用钢筋混凝土薄壳结构,鉴于施工工艺和技术原因,宁夏固海扬水工程已建渡槽漏筋、渗漏水问题突出,造成水量损失和基础冲刷影响运行安全等问题.由于宁夏
随着经济在快速发展,人们生活水平在不断提升,对于电力的需求在不断加大,电力系统的重要性正在日益凸显,而变电运行在电力系统中占据十分重要的位置.变电站运行的整体情况直
胡锦涛总书记在庆祝中国共产党成立85周年暨总结保持共产党员先进性教育活动大会上的重要讲话,坚持以马克思列宁主义、毛泽东思想、邓小平理论和“三个代表”重要思想为指导,
文章的前言部分探讨了当前基于两层客户/服务器模式建设电子商务系统存在的问题 ,并提出了一个基于Windows DNA的解决方案.第一章系统介绍了电子商务的理论及其关键 技术,并
古往今来,琵琶艺术的魅力有无数的前人进行描述和探索。琵琶的历史源远流长,它是中国传统文化的代表,是外来文化与中国传统文化融合的杰作。丰富独特的艺术形式及深邃的气韵,
2008年,常州市博爱小学以“取消语文书面家庭作业”为契机迈出了减负增效的步伐,开始进行开放的语文教学实践探索。
立体化教学是一种新兴的教学方式。不同于传统课堂的教学模式,立体化教学能使学生在学习过程中多方面能力得到协调发展。在全球化日益发达的今天,大学英语教育中更应重视学生
近年来,社会进步迅速,人们生活水平提高,对建筑的要求也越来越高.国家对于城市基础建设的投入比例非常大,城市化发展进程也越来越快,人们对于房间质量的要求也越来越高.目前
该文作者结合首信集团和中科院联合开发的GSM移动终端协议软件项目对GSM移动终端中点到点短消息业务的实现中的一些问题:模型的建立,接口的制定,存储管理,运行设计和异常情况