【摘 要】
:
N-gram语言模型在诸如词预测、机器翻译等中都有广泛的应用,但也存在着不能很好地描述语言中长距相依的现象,更不能有效解决复句中的子句相依问题.本文提出了通过利用复句中的关联词结合N-gram语言模型为复句建立语言模型,以刻画复句中的子句相依现象.实验结果表明:对带有关联词语的复句,该语言模型的复杂度比传统N-gram语言模型的复杂度减少近30%.
【机 构】
:
北京邮电大学,计算机学院,智能科学与技术研究中心,北京,100876
论文部分内容阅读
N-gram语言模型在诸如词预测、机器翻译等中都有广泛的应用,但也存在着不能很好地描述语言中长距相依的现象,更不能有效解决复句中的子句相依问题.本文提出了通过利用复句中的关联词结合N-gram语言模型为复句建立语言模型,以刻画复句中的子句相依现象.实验结果表明:对带有关联词语的复句,该语言模型的复杂度比传统N-gram语言模型的复杂度减少近30%.
其他文献
Convergence is a very important concept in credibility theory.There are four main types of fuzzy variables in credibility theory:equipossible fuzzy variable,triangular fuzzy variable,trapezoidal fuzzy
This paper proposes the new concept of fuzzy maximum likelihood estimator based on credibility distribution of fuzzy variables.The invariance properties of fuzzy maximum likelihood estimator are inves
Given a fuzzy variable,what is the degree of difficulty of predicting the specified value that fuzzy variable will take? Entropy provides a measure to characterize the fuzziness.As we know,image segme
In this paper,we present a multidimensional model describing the hybrid financial market.The definition of no-arbitrage,No-arbitrage theorem and determinant theorem of no-arbitrage are given based on
设A是Banach空间X中的闭的稠定线性算子,且A生成一个指数有界的(C)-正则预解算子族[R(t)]t≥0.本文主要研究了(C)-正则预解算子族的加法扰动,并给出了扰动后的算子族的公式表示.
Bonferroni curve and Bonferroni index are used to provide a sensitive measure of income inequalities.In this paper,we proposes the new concept of credibilistic Bonferroni curve and Bonferroni index ba
对减速机故障形式进行分析,采用BP神经网络建立故障诊断模型,利用遗传算法优化神经网络权值、阈值、网络结构.将遗传神经网络模型应用到远程减速机的故障诊断的设计中.比较单一的神经网络和遗传神经网络的训练误差曲线,得出遗传神经网络在训练速度和准确性上远远高于神经网络训练模型.
基于LaSalle不变定理和Lyapunov方法,针对混沌系统同步提出了一种改进的自适应反馈方法. 与一般线性反馈系统不同,这种方法能自动调整更新规则的可变反馈变量,在该自适应更新规则的控制下,反馈强度可自动调整到新的自适应规则,从而可使响应系统的状态全局同步于驱动系统的状态.Chen氏混沌系统和Lü氏混沌系统说明了所设计的自适应反馈方法的有效性.
Page Rank算法是著名的通用搜索引擎的Web页面排序算法,但是对具体主题的信息检索,却存在主题漂移的问题,查询相关的Page Rank算法根据用户输入的查询关键词在原始的Page Rank算法基础上修改了分配给链出网页的重要度比例和直接跳转概率,但是没有考虑主题在页面中的重要度,本文分析了面向主题的页面排序算法,在查询相关的Page Rank算法基础上做了一点改造,提出了面向主题的查询相关网
利用提升格式原理构造了一个对称的具有二阶消失矩的第二代小波dec,并将其应用于漆酶基因的编码部分的Hurst指数的提取.与经典小波db2、sym2和coif(1)的提取结果相比较,虽然他们都可以证明在漆酶基因的编码部分存在着长程相关性,但dec比db2、sym2和coif(1)的提取结果更符合人的视觉观察所产生的对AT walk、AC walk和AG walk的Hurst指数的猜测.