智能数字助听器中声场景分类的研究

来源 :东南大学 | 被引量 : 4次 | 上传用户:rengegoodluck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的不断发展,老龄化问题越来越突出,这促使了人们对耳聋问题的关注,助听器的发展开始受到人们的普遍重视。声场景分类作为智能数字助听器的核心技术,其算法处于信号处理的前端,能够识别出助听器使用者当前的听觉场景,自适应地调用相应的处理程序,实现针对不同场景声信号的个性化处理。本质上讲,声场景分类属于环境声识别问题,主要包括两个方面:特征提取和分类。特征提取是对声信号进行维数约减,提取出能代表原始信号的数据;而分类是指通过一定方法编码声特征,并与模板数据库进行比对以确定声信号所属类别。本文主要围绕选择性注意模型、传统的HMM模型和深度学习模型来展开对声场景分类的研究。在特征提取方面,本文通过对声信号的语谱图做显著性分析,提取出显著图特征,再将其与传统的MFCC特征进行混合,形成混合特征。在分类器方面,本文分别使用传统的HMM模型和深度学习模型进行分类。本文所做的工作主要有以下几项:1.阐述了声场景分类技术的研究背景和研究现状,分析了现有声场景分类技术的优缺点,并对当前有待深入研究和急需解决的问题进行了说明。2.概述了声场景分类的理论基础,介绍了声场景分类的几个模块,包括预处理模块、特征提取模块、分类器训练模块和测试模块,并介绍了声场景分类特征提取和分类器设计方面的相关知识。3.深入研究了选择性注意模型,包括选择性注意模型的理论和视觉选择性注意模型中的两种常用模型——Itti模型和GBVS模型,并将视觉理论应用于声学中,完成了对声信号语谱图的显著性分析,提取出了声信号的显著图参数。4.利用提取出的显著图参数得到用于分类的特征向量,再提取出声信号的MFCC特征,将二者进行混合,组成混合特征,再利用传统的HMM分类器分别使用单独的显著图特征、单独的MFCC特征和混合特征完成对声场景的分类,并比较各自的分类效果。5.简述了深度学习的发展历程、主要模型和应用,介绍了深度学习常用方法,包括自动编码器、稀疏自动编码器和受限玻尔兹曼机,介绍了 Gibbs采样过程和对比散度算法,将深度学习模型应用于声场景分类过程中,采用两种常用深度学习模型——稀疏自动编码器和深度置信网络组成混合模型,该模型共包括三个部分:前面使用两层稀疏自动编码器进行构造,中间使用一个三层深度置信网络实现,最后使用Softmax回归作为分类器,再分别利用显著图特征、MFCC特征和混合特征进行实验,比较各自的分类结果。
其他文献
为了改善地铁施工工人行为安全培训的效果,利用基于内容的个性化推荐技术,研究培训内容个性化推送机制,首先,分别找出不安全行为类型与工人的工种岗位、现场施工阶段与工人施
期刊
<正>顺应市场变迁确立核心诉求在我国20世纪90年代初,国内的空调器主要以进口产品为主,消费者的购买意向以进口标志作为评判依
<正>2018年11月26-28日,"改革开放四十年中国道德发展及其理论前沿研究"研讨会暨粤苏鲁湘伦理学年会在中山大学召开。研讨会由广东、江苏、山东、湖南四省伦理学会联合举办,
信息时代的到来为各行业领域注入新鲜的活力,但因互联网开放性特点,网络盗窃、网络诈骗、网络侵权等问题屡见不鲜,致使许多群众合法利益受到损害。在此背景下便要求做好网络
三沙市对南海诸岛、南海海域和相关专项事务具有行政管辖权,但囿于南海争端和本身执法装备及执法手段的问题,三沙市在落实行政管辖权方面存在困难。欲克服这些困难,三沙市需
失地农民的社会保障问题,既关系到经济的发展,又关系到社会的稳定,妥善解决该问题是我国工业化和城市化进程中的重大任务。我国失地农民的社会保障存在着制度缺失,政策不统一
目的探究踝关节运动损伤的成因及快速康复方法。方法选取我院骨外科2015年9月~2016年4月份收治的50例踝关节运动损伤患者,随机分成对照组和观察组,每组25例,其中对照组采取常
我国北方地区干旱少雨,地表水源缺乏,造林成活率很低,重复造林使生产蒙受巨大损失。但许多地方蕴藏着丰富的地下水,通过深栽造林,可提高造林成活率,获得良好生产效益和经济效