分词歧义相关论文
随着信息技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、应用最广泛的信息库,如何有效检索这些海量信息成为当前......
针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法.充分挖掘训练......
本文以2000年的人民日报为研究载体,共计24,181,518字,根据不同考察目的逐条分析标注,统计,得出数据,找出规律。本文先研究连词“而”识别......
摘要:本文旨在提供一种基于非监督训练的分词歧义解决方案和一种分词算法。基于EM的思想,每个句子所对应的所有(或一定范围内)的分词......

