基于HowNet的句子褒贬倾向性计算

来源 :中国人工智能学会第12届全国学术年会 | 被引量 : 0次 | 上传用户:xinxinrenren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本倾向性识别在信息过滤、自动文摘、文本分类等领域有广泛的应用前景。本研究以HowNet的词汇语义相似度计算为基础,提出了基于的语义距离和语法距离的句子褒贬倾向性计算方法。与传统的阀值法和向量空间夹角余弦法相比,较好地利用了词汇间的语义关系和当前语句中的语法关系。在部分语句的实验表明,该方法的计算结果与人工判别结果更接近。
其他文献
语义角色标注是为句子中谓词论元及附属成分标上其担任的语义角色,如施事、受事、时间和地点等等。汉语语义角色标注的研究才刚刚起步,可利用的资源还很有限。本文采用半监督
随着网络信息资源迅速增加,如何及时准确地获取所需的信息,是现代网络信息过滤技术需要解决的主要问题。本研究针对经常在某个领域检索的用户需求,利用元搜索的理论及优势,完
会议
在建筑师勒·柯布西耶一生的诸多旅行中,一次名为“东方之旅”的旅行,日后成为其最为珍视的经历.文章旨在回溯关于此次旅行的图文并构的语料库,借此探究建筑师“建筑散步”观
本研究针对汉语外国译名识别的难点,基于最大熵算法提出了一种基于规则与统计相结合的识别方法,充分考虑了外国译名的内部特征(小颗粒特征)和人名的语境信息。本文的主要贡献
会议
文本语义倾向识别是指识别某一特定主题的文本所具有的主观态度倾向性。本文基于词汇本身的语义倾向信息,提出了一种基于词汇的向量空间模型(VSM)表示算法。该算法综合利用文
为了实现基于内容的文本集主题描述,本研究提出了一种新的文本集表示模型。该方法将文本中项的频率、项的共现频率以及它们在文本集中的分布情况有机结合,构造了一种新的文本
本研究在“全信息自然语言理解”理论的基础上,运用多Agent技术研究实现了面向多领域的短文本倾向分类系统。针对特定领域,利用包含语法、语义、语用信息的领域全信息知识库,
本文提出了一种利用统计学习算法进行汉语句子骨架成分识别的方法。骨架成分识别基于短句进行,包括主语、核心动词短语、宾语等。骨架成分的单位是基本短语。利用IOB模型编码
会议
中草药是祖国医药伟大宝库的重要组成部分。运用近代科学知识和方法来研究中草药的有效成分是发掘整理提高祖国医药遗产不可缺少的重要内容。这不仅能从中草药中寻找更多防