语种识别中的隐含语义分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lanbingxingshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种识别是利用计算机对一定长度的语音材料进行处理,判别其所属语言种类的过程,是语音识别的一个重要研究方向。随着经济全球化的不断深入,语种识别在日常生活、国防军事和公共安全等领域都有着极为广泛的应用前景。一般来说,每一种语言都具有各自相对独立的音素集、韵律、词汇和句法、语法,这些差异为语种识别的实现提供了可能。根据建模思路的不同,主流的语种识别方法可以分为两大类:基于声学模型的方法和基于语言模型的方法。其中,基于语言模型的方法首先使用语音识别技术将语音信号符号化为音素序列,然后利用不同语种中音素的搭配呈现不同的规律进行语种的识别。这种方法的优点是性能稳定,扩展性好,颇受国内外研究人员的推崇。本文即围绕语言模型方法,在基于音素搭配关系的框架下,对语种识别方法进行了较为系统的研究,首先搭建了从音素识别器到语言统计模型的完整系统,然后着眼于降低算法复杂度、提高系统识别性能等方面,挖掘不同语种统计语言模型中的隐含语义结构,并取得了一定的进展。具体的研究工作包括以下几个方面:第一,比较了在音素识别前端相同条件下用不同解码方式对语种识别系统的影响,证明了用词图的输出结构比最优序列能够得到更为丰富的音素识别信息,同时构造了新的核函数,可以极大地提高语种识别的准确率。第二,在音素识别结合支持向量机的语种识别系统中,针对特征矢量高维、稀疏的特点对表征每个语音段的特征矢量采用关键词选择的方法筛选特征,降低计算复杂度,减少特征的冗余度,进一步改善语种识别系统的性能。第三,借鉴信息检索中词袋的思想,分别引入两种隐含语义分析的方法——隐含语义分析方法和概率隐含语义分析方法,选取更加鲁棒和具有代表性的隐含语义特征,缓解了高维和稀疏的问题,降低算法复杂度,提高基于音素识别结合支持向量机方法的语种识别准确率。
其他文献
随着Internet技术的飞速发展,用户已不再满足于只是在网络上浏览网页、收发电子邮件等服务,流媒体的应用越来越广泛。然而由于流媒体具有数据量大、持续时间长、占用带宽高等
扩频通信技术因为具有抗干扰能力强,频谱密度低,保密性好等特点被广泛应用。常用的扩频方式有直接序列(DS)扩频,跳频(FH)扩频,跳时(TH)扩频,线性跳频扩频(Chirp Spread Spectrum,CS
干扰认知技术是智能抗干扰系统的基础和前提,它能实时检测周围电磁传播环境的干扰空穴、识别干扰、估计信道质量(信干噪比)等,为抗干扰决策系统实施抗干扰行为提供依据。本文立足
随着国家城镇化建设的加快,社会经济体制改革,人民生活质量提高,各类新型犯罪形式的出现及犯罪手段水平的提高,都对公安系统的信息化建设提出了新的要求,尤其伴随着大型视频
卫星通信系统在空间传输中易受到干扰影响。研究相应的抗干扰措施可以保证通信的质量。此外任何一个通信链路中,同步都是一个很必须的部分。良好的同步是完成对信号的正确接
网格计算是分布式计算的一种,它是利用互联网或其它专用网络将地理上广泛分布的、异构的、自治的、动态的各类软硬件资源互联起来而整合成的一台虚拟“超级计算机”,它可以为
语音转换是一种改变源说话人的语音个性特征,使之听起来像另外一个我们称为目标说话人的声音的技术。语音转换的基本要求是转换后的语音具有目标说话人的个性特征,但是并不改变
数字音频水印技术已经成为多媒体信息安全研究中一个新的研究热点。本文针对实时性音频水印会经常遇到的D/A和A/D变换问题展开了研究,通过优化音频水印算法,对基于DSP的实时
随着航空产业的飞速发展,航空通信在日常生活和军事应用中占据越来越重要的地位。针对特定干扰环境中的航空无线通信,如何有效的对抗干扰,实现可靠的数据传输是需要重点研究
在信息化社会的今天,移动通信正在以飞快的速度发展着。但是由于信号不可能覆盖到所有的区域,因此就产生了弱信号区和盲区。对于这些区域,我们通常利用了直放站的射频信号功