基于压缩感知的语声信息恢复方法及实现技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:homemoons
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语声信息恢复是通信声学系统中的关键技术之一,旨在通过消除噪声干扰和恢复被噪声掩蔽的语声信号成分,达到提高语声信号的可听度与可懂度的目的。压缩感知理论是近年来提出的一种新的很有前景的信号处理理论与技术,它通过较少的观测采样值就能够实现信号的准确或近似重构,其中稀疏表示和信号重构是压缩感知的两个关键理论部分。本文研究了压缩感知理论,探索了其应用于语声信息恢复的方法及其实现技术,其技术路线为:利用稀疏表示理论,将带噪语声信号变换某个表示域,使干净语声和噪声的表示分别具有稀疏性和非稀疏性,以区分出带噪语声信号中的干净语声信号和噪声信号,然后修改信号重构算法,消除带噪语声中的噪声干扰,恢复出原始被噪声掩蔽的语声信号成分,从而达到语声信息恢复的目的。本文重点研究压缩感知理论框架下的语声信息恢复技术,主要的研究内容与创新点包括以下方面:  1.建立了干净语声信号的稀疏表示数学模型,采用正交匹配追踪算法近似求解不同约束条件下的干净语声信号的稀疏表示,从而近似重构出原始干净语声信号,还原了原始干净语声信息。  2.建立了一种基于稀疏重构的语声增强数学模型,提出了一种可兼顾语声稀疏性和非平稳性的语声存在概率加权的加权正交匹配追踪语声增强算法,达到了消除噪声干扰、保留语声信号的目的,实现了语声增强的目标。  3.建立了一种基于稀疏重构的语声恢复数学模型,提出了一种类比于图像去噪恢复技术的基于K-SVD的语声恢复算法,达到了消除噪声干扰和恢复被噪声掩蔽语声信号成分的双重目的,解决了传统算法无法恢复被噪声掩蔽的语声信号成分的问题,实现了语声信息恢复的目标。
其他文献
多目标检测与跟踪作为计算机视觉的重要组成部分,在智能监控、人机交互、无人驾驶、视频会议、医疗图像分析等领域有着广泛的应用。目标检测的目的是从待测图像中提取出感兴趣
讨论了高校图书馆文献资源配置,提出了文献资源配置和文献资源的效用评价,以期文献资源配置效用最大化.参考文献2.
随着信息技术的飞速发展,以组播方式传输H.264压缩视频已经成为信息交互的重要模式。由于视频传输的质量决定了用户的观赏体验,视频传输质量控制一直以来都是提升视频传输产品
该文先从软件无线电的概念及其其产生的背景出发,以其在移动通信基站中的应用为例,分析了软件无线电典型的功能结构的三个部分:实时信道处理流程、环境管理流程、在线和离线
计算机视觉是人工智能领域中非常有影响力的研究课题,占据着极其重要的地位。人脸识别问题尤其是跨年龄人脸识别问题是计算机视觉中非常重要的子问题。跨年龄人脸识别在实际生
接收机是声纳系统的重要组成部分,为了满足工程开发和批量生产对接收机各项性能指标的自动化检测需求,本文设计了多通道声纳接收机测试系统。声纳接收机的性能指标主要包括通道
学位
研究人员给出的一个解决方案就是语音增强技术,因为以往的电子耳蜗并没有充分考虑到人的内耳的语音增强功能,论文实质上就是在电子耳蜗植入这一应用背景下发展高性能的语音增
本文主要对光子晶体通信器件进行了研究。光子晶体通信器件较普通光学器件无可比拟的优势。有着使用平面波展开法,有限时域差分法等对光子晶体波导、谐振腔、自准直效应等就行
该文在讨论了数字通信系统框架、信道编码及交织技术、数字调制技术及衰落信道的仿真、多级编码(MLC)系统的基础上,采用计算机仿真的方法,研究了采用BCH码做分量码且码率分配