基于小波和支持向量机模型的音频分类研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:new37143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的内容语义和结构化信息是音频信息深度处理、基于内容的音频检索以及辅助视频分析等应用的关键。基于内容的音频分类作为解决音频结构化问题的核心技术,是当前音频内容自动分析领域的一个研究热点。支持向量机SVM(Support Vector Machines)是近年来机器学习研究的一项重大成果。作为一种新的机器学习方法,SVM能较好地解决小样本、非线性和高维数等实际问题,因此成为继神经网络研究之后新的研究热点。本文围绕音频分类的两大技术难点——特征分析与抽取以及分类器设计展开研究,主要内容如下:(1)概要地介绍了SVM的基本理论,提出使用多类分类方法来研究音频分类。(2)本文从帧层次上分析了不同类音频之间的区别性特征,对车鸣声,钟声,风声,冰块声,机床声和雨声等六类环境音进行分类。实验结果表明,基于SVM多类分类器的环境音分类性能较好,最优分类精度达到97.73%。(3)介绍了小波分析的理论知识,并尝试了结合小波分析和傅立叶分析进行音频特征抽取,其中对子带能量比和子带过零率等采用小波分析抽取,MFCC(Mel-Frequency Cepstral Coefficients)特征则采取傅立叶分析抽取,并在本文提出的SVM多类分类器上实现六类音频分类。结果表明该方法是一种有效的音频特征抽取方法,分类精度高于帧层次特征抽取。
其他文献
脉冲超宽带(IR-UWB, Ultra Wide Band Impulse Radio)通信技术采用直接发射纳秒级、亚纳秒级的极窄脉冲来传输信息,具有传输速率高、安全性好、系统结构简单、穿透能力强、低
随着信息产业的飞速发展,人们对于卫星通信的需求更加迫切。低信噪比高动态同存条件下的载波同步技术是实现卫星通信的基础。载波同步技术包括载波的捕获技术与载波的跟踪技