朝鲜语语音识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zwx2738
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
黏着语是语言形态学中的一个语言类别,这一类别的语言需要大量依靠词素的屈折变化来表现文法关系。由于语音识别技术在发展历程中主要的研究对象是分析语或低屈折度语言,因此黏着特性对主流语音识别技术构成多项挑战。本文以朝鲜语为例对黏着特性进行研究,力图削弱黏着特性所带来的负面影响,同时尝试使用黏着特性获取对语音识别系统及相关应用有益的额外信息。  本文主要在如下几个方面进行研究:  (1)本文根据对朝鲜语语言学特点的分析,确定朝鲜语的黏着特性导致高声学模型混淆度问题。作为解决方案,本文提出依据朝鲜语语言学知识的扩展音素集方法,对由拼写方式导出的基础音素集进行有效区分,从而使识别效果得到提升。  (2)本文针对主流语音识别系统中所使用的短时特征在时域上获取信息能力较弱的问题,提出使用长时特征辅助协同发音信息的获取。协同发音现象是朝鲜语黏着特性所导致的,通常需要较为广泛的时域信息进行描述。在使用长时特征后,基于语言规则或数据驱动的同位音素分离方法均得到大幅改善。  (3)本文针对同位音素分离方法严重依赖于语言学知识的问题,提出自动化同位音素分离方法。自动化同位音素分离方法利用对训练数据的分析,将语言学规则中被认为具有相同发音的音素区分为同位音素单独进行建模并取得良好效果。此外,由于不需要语言学知识,自动化同位音素分离方法可以简单推广至其他黏着语,本文以维吾尔语为例进行附加实验,结果表明这一方法具有很好的可推广性。  (4)本文利用不同词聚合度类型关键词之间的置信度分布差异,对朝鲜语关键词识别系统进行改良。词聚合度是朝鲜语黏着特性所提供的额外属性,代表黏着语由大量词素聚合而成的自然词在子词切分后所产生的子词的数量和类型。实验表明基于词聚合度的置信度规整方法可以有效提升关键词首选精度,从而说明对黏着特性的有效利用亦可以改善语音识别相关应用。
其他文献
讨论了高校图书馆文献资源配置,提出了文献资源配置和文献资源的效用评价,以期文献资源配置效用最大化.参考文献2.
随着信息技术的飞速发展,以组播方式传输H.264压缩视频已经成为信息交互的重要模式。由于视频传输的质量决定了用户的观赏体验,视频传输质量控制一直以来都是提升视频传输产品
该文先从软件无线电的概念及其其产生的背景出发,以其在移动通信基站中的应用为例,分析了软件无线电典型的功能结构的三个部分:实时信道处理流程、环境管理流程、在线和离线
计算机视觉是人工智能领域中非常有影响力的研究课题,占据着极其重要的地位。人脸识别问题尤其是跨年龄人脸识别问题是计算机视觉中非常重要的子问题。跨年龄人脸识别在实际生
接收机是声纳系统的重要组成部分,为了满足工程开发和批量生产对接收机各项性能指标的自动化检测需求,本文设计了多通道声纳接收机测试系统。声纳接收机的性能指标主要包括通道
学位
研究人员给出的一个解决方案就是语音增强技术,因为以往的电子耳蜗并没有充分考虑到人的内耳的语音增强功能,论文实质上就是在电子耳蜗植入这一应用背景下发展高性能的语音增
本文主要对光子晶体通信器件进行了研究。光子晶体通信器件较普通光学器件无可比拟的优势。有着使用平面波展开法,有限时域差分法等对光子晶体波导、谐振腔、自准直效应等就行
该文在讨论了数字通信系统框架、信道编码及交织技术、数字调制技术及衰落信道的仿真、多级编码(MLC)系统的基础上,采用计算机仿真的方法,研究了采用BCH码做分量码且码率分配
语声信息恢复是通信声学系统中的关键技术之一,旨在通过消除噪声干扰和恢复被噪声掩蔽的语声信号成分,达到提高语声信号的可听度与可懂度的目的。压缩感知理论是近年来提出的一