困惑度相关论文
随着互联网络和信息技术的快速发展,人类获得信息的途径越来越多,然而如何在大量数据中获得符合用户喜好的信息,给用户带来更好的体验......
为了获得高质量的NMT模型,大规模并行语料库是必不可少的。使用反向翻译构造伪造语料库,这些伪造语料中存在大量的噪声,这些噪声会......
自然语言处理是计算机科学中一个引人入胜、富有挑战性的课题。它的任务是建立一种能够模拟人类语言认知过程的计算模型。但是当前......
语言模型在语音识别中占据着重要的地位,它担负着把拼音转化成汉字的重任,语言模型性能的好坏直接影响到语音识别的结果好坏。当前......
学位
近年来,卷积神经网络在很多领域都取得了显著的成功,尤其是在图像识别领域,其准确率已十分接近甚至超过相关专家的水平。然而,卷积......
语言模型是语言知识的主要表现形式,语言模型的研究成果必将有助于提升自动文摘、语音识别、机器翻译等多种自然语言处理系统结果......
本文在大规模语料的基础上,利用语言模型中稀疏事件的概率估计方法对汉语的熵进行计算,并讨论了语料规模等因素对熵的影响.在4年的......

