融合通信中智能语音交互技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:zjj1993930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信和互联网技术的发展,企业和个人用户拥有了越来越多的通信方式,但如此之多的通信方式给人们带来便利的时候,也给用户的管理带来了不便。融合通信能够提供任何时间、任何地点、任何设备实时或非实时的接入,提供随时随地的通信能力。在融合通信中,通过交互实现语音功能,可以有效的丰富融合通信的功能。本文研究了一种新颖的语音交互技术,采用服务器-客户端交互的方式实现融合通信中的语音应用场景功能。融合通信终端实现基本的语音功能,复杂的智能语音处理功能由服务器实现,客户端和服务器之间通过网络建立交互,进行音频和文本的传输。具体研究内容和主要工作如下:   本文研究了Linux下的音频设计开发的方法。首先论述了在Linux系统下Open SoundSystem平台上编程的规范与具体实现。其次,介绍了语音识别和语音合成的基本原理。最后,研究并阐述了在本课题中使用的两种语音引擎SAPI和AISpeech的原理、实现步骤和相关的接口介绍。研究了一种融合通信平台中的智能语音终端的构建方法。首先介绍了融合通信平台的构建过程。其次,介绍了智能终端软件模块的划分。再次,在此基础上研究了在终端实现语音播放、录制和存储功能的方法。研究了语音交互方式的实现。首先,研究了智能语音终端通过局域网套接字与服务器相连的方法。其次,研究了在语音服务器上实现几种常用的智能语音交互功能的方法,包括文件存储、文件格式转换、语音合成交互、语音识别交互等。最后,在实现语音交互的基础上,研究了几种实际应用场景的建立,包括通话录音、语音拨号功能,提出了实现多种情景模式的方案。给出了融合通信系统中语音交互的运行与测试。首先,研究了交叉编译环境的建立和分析了智能语音终端的测试结果。其次,研究了语音服务器的搭建和对各种语音功能进行了测试。最后总结了本文所做工作并对下一步的研究工作进行了展望。
其他文献
时间延迟和波达方向是无线信号传播的两个基本参量,从中还可以得到信号的其他重要相关信息。长期以来,两者一直都是信号处理领域中的热门研究课题,具有重要的理论意义和应用
本文致力于能够最好地利用无线电和硬件资源的认知无线电(CR)方面的无线资源管理(RRM)。我们探讨CR中用于RRM的进化优化技术以及实现先进传输技术以适当的成本和复杂性来提高CR效