论文部分内容阅读
在互联网飞速发展的今天,海量的文本数据在网络上共享传输,文本的自动分析处理成为一个研究热点,而文本中包含情感的获取对于语义的理解有着直接作用,情感知识库在这一工作中是不可或缺的资源。只有建立起正确有效的情感知识库,才能为后继的情感分析工作提供坚实的基础。本文的主要工作和贡献如下:论文首先对现有语义知识库的结构进行详细研究,根据现有知识库的构建特点,以及对情感分类的深入研究,结合情感分类以及语义分类建立了新的中文情感知识库构架,设计了情感知识库的组织结构和情感知识描述体系,并给出了情感知识库的应用实例。本文着重研究了情感知识库中知识的自动生成,其中包括基础情感词典的生成,同义词集合的DEF定义,褒贬计算,以及情感分类和多情感词汇的处理。最后本文通过将未登录词进行概念切分以及自动生成语义表达式,实现了情感知识库的自动扩充。应用文中构建的情感知识库,研究了文本情感倾向性分析的问题。改进并引入知网的情感倾向判断算法,根据知识库重新选择了情感种子词组,并利用情感知识库中的同义词集合扩大种子词的语义覆盖面,补充了常用方法中种子词语义覆盖不足的缺点。最后,通过实验验证了算法的合理性,以及中文情感知识库的现实应用意义。