【摘 要】
:
人机交互(HCI:human computer interaction)是计算机科学的一个相当重要的研究领域。语音合成、语音识别、面部表情识别、姿势识别以及姿势合成等研究都是这一领域的重要组成
论文部分内容阅读
人机交互(HCI:human computer interaction)是计算机科学的一个相当重要的研究领域。语音合成、语音识别、面部表情识别、姿势识别以及姿势合成等研究都是这一领域的重要组成部分,并且都取得了很好的进展。但是这些研究都是在单一交互通道上进行的。而现实中人与人在交际过程并不是仅仅通过一种途径来表达和传递信息,而是多种途径共同表达。所以想要使计算机能够和人进行自然的交流,就必须理解人的这多种途径表达信息之间的相互关系。本文的研究目的就是以解释多种途径表达信息之间的关系为出发点,研究交际过程中的姿态表达和言语特征的关系,具体来说就是研究姿态表达和语音表达的关系。本研究得到国家863项目“自然人机交互中口语产生新方法的研究”(编号2006AA01Z138)支持。本文以4段电视访谈节目的视频和音频为原始数据,在本文提出的多模态标注系统的基础上对视频信息进行了姿态标注,并对语音信息进行了韵律标注。然后对音频和视频的标注信息进行提取,用统计学的方法对数据进行了分析。研究结论支持语音与姿态表达之间的关联理论(Interface Hypothesis)。本文的结构分成3个部分:首先提出了多模态标注系统,然后通过一个感知实验来观察姿态与语音信息在语言理解中的关系,最后分析了语流中重音与手部动作之间的关系,手部动作和头部动作在协助语音表达时的关系,还分析了语流中韵律边界和手部动作之间的关系。
其他文献
基于信号的稀疏性,压缩感知方法能够同时完成传统的信号获取中采样和压缩的两个过程,从而突破了传统奈奎斯特采样定理的限制,使得信号的采样率、采样时间以及存储成本大大降
随着计算机应用的日益普及和深化,计算机软件的数量急剧膨胀,软件规模十分庞大。然而,软件的在开发和维护过程中的一些模糊或错误做法和概念,致使很多项目不幸夭折,其中很多
信息是当今人类社会的重要资源,它必然要面对各种各样的安全威胁。在我们越来越依赖于信息技术的同时,信息安全的问题也日益突出。信息安全已经成为当前研究的热点课题,作为信息
随着数字网络通讯的飞速发展以及数字多媒体的广泛应用,对数字产品版权保护的需求也日益迫切。数字水印技术已经成为用来解决数字多媒体中版权问题和内容认证的主要工具。本
Internet技术的发展、移动设备的普及以及微博、微信等应用的兴起促进了网民对Web新闻的接触度,碎片化时间阅读Web新闻已经成为了Web用户的主要活动之一。然而,Web新闻网页中
本文探讨了中美关系正常化中的台湾问题,指出20世纪60年代末、70年代初,中美基于共同的战略利益,在台湾问题上达成了妥协和谅解,实现了关系正常化.
随着的Intemet飞速发展,人们利用Intemet发展和共享各种信息,使得信息爆炸式增长,普通网络用户查找所需资料变得非常困难,搜索引擎正是为了解决这一问题而发展起来的。而现在的搜
在传统的信息检索方式下,由于信息资源缺少统一的语义描述,用户难以快速查找到与需求相关的资源,难以实现信息资源的语义共享。如何使信息资源具有应用程序可以理解的含义,并根据
计算机技术的不断普及以及硬盘技术的迅速发展使个人计算机中的文档数量以惊人速度增长。如何有效地管理和利用这些文档,是需要解决的重要问题。近年出现的基于全文索引的桌
近年来,分布式P2P研究升温,分布式搜索技术更是当前研究的热点。google,baidu都期望产生下一代新的分布式搜索引擎。因此,分布式搜索算法的研究具有很广泛的意义。 论文首先分