基于区域的图像理解技术研究及其应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:hyhlj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像理解技术是计算机视觉的一个重要课题,在很多方面有应用前景,因此受到了学术界和工业界的广泛重视。本文从区域分析的角度,从图像区域标注,图像搜索,图像编辑三个方面来改善图像理解的性能。区域是存在于局部特征点和全局图像之间的一个中间的语义单元。相比于局部特征点,区域能够保持更加丰富而完整的语义,能够从一定程度上减少语义鸿沟;相比于全局图像,基于区域的特征表示更加灵活,能够部分解决图像配准的问题。图像的区域一般是通过图像分割或者物体检测得到,而从图像区域内部提取的高维特征一般都存在噪声和冗余。如何从大量的无关特征中提取最有信息量的特征子集也是一个难题。虽然区域分析在图像理解中起到了举重轻重的作用,但是这方面的研究工作却不多。因此,本文从以下四个方面,全面的考虑了区域分析在图像理解中的应用:   ·图像特征的自适应选择。近年来,越来越多的特征,例如颜色,纹理,形状特征等,都被证明可以增强计算机视觉系统的性能。但是在移动设备中,由于存储空间和计算能力的限制,如何在保证系统性能不降低的前提下,有效地选择少量最关键的特征是一个亟待解决的问题。   ·图像区域的自动标注。随着互联网上用户标注图像数目的快速增加,如何根据图像的标注,自动地估计像素的标注,从而更完备地理解图像内容是一个颇受研究者们重视的问题。由于图像的标注和像素的标注的层次不同,因而跨层的标注传递是极其困难的。   ·跨场景的图像检索。图像检索是图像理解的一个重要任务。现有的大量的工作都集中研究同一个域内部的图像检索问题。但是如何在查询图像和数据库图像来自不同域的情况下,依然保证搜索的准确性就成为非常有挑战性的问题。   ·图像的自动编辑。图像编辑,由于其潜在的巨大娱乐价值,收到了工业界的极大重视。但是当下实用的图像编辑系统都是由专业的图像编辑人员使用特定的图像编辑软件实现的。如何实现大规模图像集的自动编辑是一个极有意义而极具挑战性的问题。   本文中,针对上述几个问题,我们在模式识别、计算机视觉、多媒体、机器学习等技术方面做了以下研究工作:   (1)提出了基于信息熵的自适应特征选择方法,该方法能有效地选择最有判别力的特征,并且能自动地决定有效特征的个数。   (2)提出了基于图模型的弱监督协同图像解析方法,该方法结合多示例学习以及图模型的思想,根据图像级别的标注,推断出像素级别的标注。   (3)提出了一种跨场景图像检索方法。为了减少查询图像和待搜索数据库这两个不同场景图像之间的差异,我们提出先对人体部位配准,然后借助辅助集多任务重构的方法。该方法可以用于移动设备中的服装搜索,当用户拍摄一件衣服之后,我们的系统可以自动地从在线购物网站找寻相似的服装。   (4)架构了一套自动的图像编辑系统,使得大规模的图像编辑成为可能。该系统的一个典型应用就是自动编辑用户移动设备中的个人照片,增强手机用户的娱乐体验。总的说来,本文针对基于区域的图像理解技术及其应用做了有益的探索。
其他文献
随着电力系统输电电压等级和传输容量的不断提高,传统的电磁式电流互感器由于存在绝缘性能差、磁滞、磁饱和、精度低等缺点已难以满足当今社会的需要。光纤电流互感器由于具
多目标跟踪系统在军事和民用方面都有着广泛的应用,多目标跟踪算法是多目标跟踪系统的关键和难点。人们对于多目标跟踪算法已进行了半个多世纪的研究,提出了很多种多目标跟踪算
用户兴趣模型是个性化服务的关键组成部分,旨在发现和挖掘特定个体或群体的特征信息,从而为个性化服务的展开提供信息支持和决策依据。到目前为止,全球范围内对用户兴趣的研
异步起动永磁同步电机(Line-Start Permanent Magnet Synchronous Motor―LS-PMSM)是具有自起动能力的永磁同步电机,其兼具感应电动机和电励磁同步电动机的特点。该种电机采用
三维可视化技术的飞速发展及目前教学设备及方法存在弊端的现实,使虚拟实验室的建立成为推动教育模式信息化的有效方法,已逐步成为最近几年国内外实验课程教学研究和应用的热点
运动平衡技能来自于运动神经系统的学习,其中操作学习发挥了重要作用。探索运动神经系统中的操作学习机理,模拟和复制其中的自组织控制机制,并应用于机器人系统,使机器人通过学习
月面巡视器将是我国对地外星体表面开展探测工作的首个智能机器人。按照我国探月工程的实施计划,预计在2013年将实现探测器在月面的软着陆和对月面的巡视勘察。由于月面巡视器
随着现代城市的高速发展,每天都有大量的人流和物流需要输送。传统的悬吊式垂直提升系统,受制于钢绳材料构造等因素,提升高度和提升速度等都存在一定的限制。一般提升系统中,一台电机只能驱动一个轿厢,为提升运载能力,高层建筑建造时不得不投入更多面积用于提升系统。直线电机驱动的提升系统,打破了传统吊绳提升系统的限制。因此,直线电机驱动的提升系统作为一种可靠高效的提升系统,是未来提升系统的发展方向。本文总结了直
动态光散射技术是测量亚微米及纳米颗粒的有效方法,它通过散射光强的自相关函数获得颗粒粒度及其分布。但是单一角度的动态光散射技术,实验获得的测量信息少,反演获取的颗粒
数据的特征提取(或数据降维)及分类是数据建模与数据挖掘的基本问题,也是模式识别的关键与核心所在,而流形学习与半监督分类是近年来所兴起的数据特征提取(特别是低维特征表