【摘 要】
:
多媒体包括文字、图像、图形、音频、视频等多种媒体形式。多媒体处理技术相应的涵盖了以上各种媒体形式及其集合的相关处理技术。本报告主要汇报四个多媒体处理技术,包括两
论文部分内容阅读
多媒体包括文字、图像、图形、音频、视频等多种媒体形式。多媒体处理技术相应的涵盖了以上各种媒体形式及其集合的相关处理技术。本报告主要汇报四个多媒体处理技术,包括两个图像处理方面的技术,一个视频处理方面的技术,和一个图形处理方面的技术。另外博士后期间在导师指导下做的有关视频检索方面的工作接近完成,在报告的最后简单汇报。
照片是最常见的一种位图形式,非常容易获取,因而是一种有非常广泛的传播和应用的媒体形式。本报告中的两个图像处理方面的技术都是针对照片的。
第一个技术是提高图像的构图。我们提出了一种可以自动检测主体干扰的方法。该方法结合了主体检测以及基于人的视觉注视特征的自底向上的注视点检测技术。对于单一人像照片,本方法可以快速的、全自动的进行干扰检测和构图推荐。实验结果表明,该方法产生的结果接近专业摄影师的建议,在相机固件发展及指导用户构图方面有着应用前景。
第二个技术是结合近红外闪光灯拍摄的照片对低光度条件下拍摄的可见光照片进行降噪和细节增强,为此我们建了一个可同时拍摄近红外与可见光照片的拍摄系统。实验结果表明我们的新方法比以前的图像降噪和细节增强方法效果更好。
视频风格化是一类常见的多媒体处理技术。我们提出了一种基于快速纹理传播的新方法将一幅图像的风格传播给一段视频,如把一幅卡通画的卡通风格传播到一段普通拍摄的视频中。该方法可成功减少风格传播中常见的闪烁、污点、及拖影问题。
当前的计算机图形应用中,比如变形,所使用的模型通常是高精度的。为了避免繁重的计算开销,高精度模型经常通过一个简化的结构来控制。该简化结构包着高精度模型,被称作“控制笼”。然而,目前控制笼主要是通过手动的方式来构造,非常耗时耗力。本报告中将介绍一种自动构造控制笼的方法,可为二维多边形和三维三角网格自动生成控制笼。通过本方法,用户只需根据应用指定一个控制笼的顶点数参数,即可构造出相应的包住输入模型的全部或局部的控制笼。通过控制笼,用户可以更加直观地和高效的控制高精度模型。
其他文献
近年来,JavaScript作为客户端Web应用最受欢迎的编程语言,受到了学术界和工业界的广泛关注。客户端JavaScript具有三个显著特性:1)弱类型与高度动态;2)事件驱动;3)操作复杂DOM对象
高光谱成像技术是20世纪80年代初在遥感界发展起来的新兴研究领域,是上世纪末本世纪初的遥感前沿技术。高光谱遥感的光谱分辨率在可见光区高达纳米数量级,往往具有波段多的特点,在可见到近红外光谱区其光谱通道多达数十甚至数百。高光谱成像系统的传感器接收到的地面辐射,既包括了地面反射光谱信息,也记录了大气辐射传输效应引起的地面反射辐照度的变化信息。在实际传输过程中,由于受到大气分子、气溶胶等的吸收和散射,电
随着越来越多的音乐资源被上传到互联网上,使得用来处理音乐数据库的音乐信息检索系统受到了越来越多的关注。目前,很多音乐网站都是根据流派信息来组织数据库中的音乐资源,因此
近年来,大规模问题引起了人们越来越多的关注。大规模数据对机器学习算法提出了更高的计算复杂性要求:包括存储和计算两个方面。 支持向量机(Support Vector Machines,SVMs)
随着大量可无线联网的智能移动终端的出现,给用户的工作生活带来了诸多便利,使得基于位置的服务得到了快速的发展,但也向计算用户位置的无线定位技术提出了更新更高的要求:易用
随着计算机技术和网络的发展,软件面临着越来越多的安全问题,人们对可信软件的需求也随之变得愈加强烈。可信软件的构建是当前国际上信息安全领域的研究热点。一般来说,软件包括
本文的研究目的在于通过分析大规模搜索日志来理解搜索引擎用户的行为特征。通过设计和建立出具有16个一级分类和90个二级分类的Query分类体系,并在此基础上构建具有8.6万词的
随着计算机技术的发展,软件规模的不断扩大,软件的安全问题正成为业界日益关注的焦点。导致软件安全问题的根本原因是其中存在的脆弱性,而脆弱性的检测作为保障软件安全的有效手
操作系统是最基础的计算机软件之一,其可靠性、安全性、性能等对于整个系统的正常高效运转至关重要。操作系统的架构可以是宏内核的,也可以是微内核的。相比于宏内核操作系统
软件功能在不断增强的同时,软件的庞杂程度也在提高,这样就无可避免的带来软件漏洞。软件漏洞攻击带来的巨大经济损失,迫切需要我们对各种漏洞攻击的方式进行剖析,从而深刻理解攻