论文部分内容阅读
对于说话者人脸合成和视频综合编码,由语音或文本预测说话者口形是很重要的。通过对汉语发音及其相关图象的研究,该文提出一种汉音声母韵发音进行分类的方法,按类建立了与口形的对应关系,并得出各类声母的基本口形和韵母的口形变化曲线;另外,作者采用多层前馈神经网络实现了由语音信号倒谱系数及能量到部分口形参数的转换。