论文部分内容阅读
(下简称)中每个同义词集对应于一个唯一的义类代码.本文的基本假设是:当这些词在文本中出现时,与它们前后同现的那些实词在统计意义上是相似的.初步实验表明,尽管根据分布的聚类过程与编者划分同义词集的机理完全不同,对词语进行聚类的结果却和语义类的平均一致率高达80%以上.本研究的意义在于,提出一种对语言学家凭语感对词的分类进行定量分析的方法,并且为计算机自动词义标注时使用语言学知识奠定了基础.