论文部分内容阅读
基于声音信号的水下目标分类识别是进行水下探测、目标体识别的可靠途径,是水声信号处理的重要研究内容。一个高识别率、适用范围广的水下目标识别系统取决于具有良好表征的提取特征和准确高效的分类器设计。由机器从数据中自主学习得来的特征表述,改变了长期以来依靠理论分析和经验总结再进行人工提取的思路。避免信号在进行变换处理时的信息丢失,获取更能充分表征信号特性的特征矢量。结合合理的分类器准确的进行分类识别,进而能够有效的提高水下声音信号的识别精度和效率。本文的研究内容为利用深度学习的方法对水下声音信号数据进行特征学习和分类识别。设计了适用于处理声音信号的深层卷积神经网络(CNN)和递归神经网络(RNN)对数据进行特征学习。同时对比包括希尔伯特-黄变换(HHT)、梅尔倒谱系数(MFCC)、声谱图等多种前人实践过的人工特征;采用包括支持向量机(SVM)、极限学习机(ELM)、回归模型(SOFTMAX)进行多分类识别,并进行实验效果比对。进而分析深度学习特征的特点和优势,实验成果有望应用于被动式声呐的水下多目标声音识别。论文内容包括以下几个方面:1、介绍课题研究背景,分析了水下声音信号的复杂性和特殊性。简述水下目标识别技术的发展历程,尤其是在时频变换求取特征的物理分析思路下的发展路径。包括从最简单的时域特征到基于傅里叶变换的频谱分析、小波分析,以及基于瞬时频率的希尔伯特-黄变换;介绍神经网络在声音信号处理的发展历程,尤其是从近年来深度学习(Deep Learning)在语音识别领域取得的突破性进展,引出本文利用深度学习的方法进行水下声音目标识别的主体思路。2、从完成系统设计的两大部分(特征提取和分类器设计)出发,介绍几种成熟的声音信号处理和特征提取的方法:包括数据的预处理;希尔伯特-黄变换的理论介绍和实现;MFCC的原理和实现。介绍几种实用的分类器:包括支持向量机(SVM)的基本原理;极限学习机(ELM)的主要思想。为本文后期的实验和对比作理论铺垫。3、介绍卷积神经网络(CNN)的结构组成以及训练方法。设计了适用于一维序列信号输入的深度卷积神经网络对目标信号进行试验,并和人工提取特征进行对比分析。从结构机理上分析深度卷积网络提取一维声音信号特征的有效性。4、介绍递归神经网络(RNN)结构特点和发展过程。介绍长短时模型(LSTM)的基本结构和作用原理,以及双向网络和深度网络的优点,介绍适用于RNN的训练方法。设计了适用于声音信号动态建模的LSTM网络对目标信号进行试验并分析。对比多种深度学习网络在同一任务下的实验效果,并给出分析。5、综合分析自动机器学习特征和人工提取特征在多种分类器下的试验,得出结论和进一步的改进思路。