【摘 要】
:
帧规整对数后验概率是目前公认最有效的发音质量的度量。本文证明了该度量反映了当前发音对应的声学模型 与概率空间中声学模型的混淆程度,使其在评分任务上存在着严重的
【机 构】
:
中国科学技术大学 电子信息工程,合肥 230027
论文部分内容阅读
帧规整对数后验概率是目前公认最有效的发音质量的度量。本文证明了该度量反映了当前发音对应的声学模型 与概率空间中声学模型的混淆程度,使其在评分任务上存在着严重的缺陷。因此提出了可训练的音素相关的后验概率变换;并研究了线性和非线性sigmoid变换,同时给出线性变换的显式全局最优解和非线性变换的梯度下降解法。在全国采集的普通话水平测试现场考试的篇章朗读题型上进行实验。实验结果表明:当概率空间包含所有音素时,该方法能使人机相关度从0.582 提升至0.768;当采用优化的概率空间时,该方法能使人机相关度从0.680提升至0.773。
其他文献
压缩感知(compressive sensing,CS)是一种基于信号稀疏性的采样方法,可以有效提取信号中所包含的信 息。本文提出了一种基于CS过程的语音增强新算法。算法利用语音在离散余弦
随着“互联网+”时代的到来,信息技术在我国各个领域中得到了广泛的应用,其中也包括教育领域.在信息化时代的背景下,传统的课堂教学逐渐向数字化、智能化、现代化方向发展,为
这是“史无前例的一年”!牛津词典的年度词汇如此评价2020年.2020年是注定载入史册的一年,一场席卷全球的新冠疫情打乱了世界原本的运行轨迹,牵动着全球经济及资本市场的波动
1971年秋天,新任燃料化学工业部革委会主任、党的核心小组代组长康世恩风尘仆仆地走入中南海西花厅.“总理,您让我来,有什么指示?”“世恩同志来了,你先坐.”周总理用他一贯
本文基于以往实验和研究,利用美国KAY公司6300型电子腭位仪(EPG),3700Multi-Speech 和南开大学“桌上语音工作室”(MiniSpeechLab)等生理声学分析仪器,在测量和统计蒙古语标准话
伴随着社会经济的发展,建筑业在我国国民经济中占据重要地位.房屋建筑及市政工程的质量备受关注,如果工程质量监管不严极易发生工程事故,严重威胁人民的生命财产安全.基于此,
每年年末,各机构分析师和专家会纷纷对来年的经济和市场进行展望,从而形成市场上对基本面的一致预期.但这些分析师和专家也不是神,很多一致预期都会被证伪.rn经济的变化错综
昔日的报人齐峰,今天的文化产业领军人,正带领山西出版集团在产业化的道路上大步迈进。三年前,山西出版传媒集团有限责任公司组建成立,齐峰将其“出版新政”全面铺开。当时,
他曾经有10个春秋一年四季都在河南黄泛区农场的苹果园里劳动。他说他的根已深深地扎在了苹果园里,从来都不曾离开,即便他后来回城,成为一名耕耘文字的作家。曾经与他一起在
动词的语义分类研究对语言信息处理来说具有重大意义。著名的词汇知识库如国外的Wordnet、国内的《现代汉语语法信息词典》等,均在自然语言处理领域发挥了巨大作用。越南