论文部分内容阅读
该文首先在动宾结构的自动获取和识别中区分了简单情况和复杂情况.针对简单的情况,设计七条规则对动宾结构进行自动获取;针对复杂的情况在运用规则自动获取的统计数据基础上,该文提出了用分布相似性估计来识别汉语动宾结构的方法.为了探讨这种方法的有效性,分别就前人在动宾结构识别中用的最大似然估计和互信息估计与这种方法进行了实验和比对.该文的另一个贡献是提出了基于句子的检索方法,它为动宾结构的自动获取和识别提供了一个快速而有效的支持工具.同时这种检索方法也可以推广到自然语言处理的其它应用领域.