基于Web的比较观点挖掘方法研究

来源 :山西大学 | 被引量 : 5次 | 上传用户:dffder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网“草根主义”的蓬勃兴起,互联网用户逐渐由被动地接收互联网信息向主动地创造互联网信息发展,互联网上产生了大量的由用户发表的有价值的评论信息。如何从这些海量数据中便捷有效地挖掘出潜在用户感兴趣的评论要点,已成为目前亟待解决的问题之一。因此,观点挖掘技术应运而生,并迅速成为信息处理领域的一个研究热点。为了能够比较精细地刻画观点挖掘的结果,本文针对句子层面上的观点挖掘问题进行了研究,主要内容如下:(1)对第二届中文倾向性分析评测(COAE2009)中与观点相关的评测任务以及我们参与评测时使用的方法进行了概述,并对评测结果做了总体的分析,在分析的基础上概括出了观点的核心要素,定义了句子层面观点挖掘的主要目的与任务。(2)研究了汉语比较句的语义角色标注问题。利用汉语比较句的句法结构建立了原始的混合比较模板,并进一步对原始模板进行了泛化以提高其召回率;然后提出了一个二级标注算法分别标注比较实体和比较属性,最终实现了比较句的语义角色自动标注。实验表明,该方法是可行的。(3)对汉语比较句进行了观点挖掘研究。提出了比较观点的描述形式,该描述形式通过对不同类型的比较结果进行了标准化处理,为它们的进一步归纳与整合提供了依据,其次,对比较句的句式构造了比较模式,按其所提供的情感信息进行了分类。最后在语义角色标注的基础上,提出了基于比较模式的比较观点挖掘算法,并在真实语料上对算法的性能进行了验证。(4)建立了基于Web的汽车评论比较观点挖掘系统。该系统集汉语比较句的识别、语义角色标注与比较观点挖掘于一体。通过网络爬虫技术定时更新后台知识库,对评论文本进行断句、分词及词性标注等预处理之后,标注识别出的汉语比较句并进行比较观点挖掘,系统最终根据用户的选择,给出与某个汽车品牌或者汽车的某个属性相关的所有对比结果。
其他文献
随着当代经济高速发展,对企业的要求也逐渐提高,于是,企业管理被提到了一个崭新的高度,而生产管理可谓是企业管理中最重要的一环,同时,生产调度又是生产管理的核心内容和关键问题,于
旋转机械是电力、石油化工、冶金、机械、航空以及一些军事业部门的关键设备。在现代生产系统中各设备之间的联系越来越紧密,由某个设备引发的故障可能引起连锁反应,导致整个设备甚至整个生产过程无法正常工作,造成巨大的经济损失。因此采集旋转机械信号,并通过各种分析方法及早地发现故障,以减小损失显得尤为重要。本文提出了一种新的故障检测方法,即等角度转速测试法。采用编码器采集机械的旋转信息,利用频率为50M的高精
人耳识别作为一种新的生物识别技术,由于人耳其特殊的生理位置和特征,在近些年来的研究中越来越受到关注。随着国内外各种研究学者的努力,有向实际应用发展的趋势。但是,在人耳识
本文以北京科技大学高效轧制国家工程研究中心项目——福建德盛镍业有限公司1150mm热连轧厂精轧区8机架的AGC系统为研究背景,根据该厂的实际特点以及轧制数据,选择了适合该厂的
卷取是轧钢的重要工艺过程,在生产中得到广泛重视。热连轧带钢地下卷取机的控制,是整个热连轧系统的最后一个关键环节,其速度和张力的控制精度将直接影响热轧板卷的产品质量,为了
聚合反应釜是聚合反应工程中的重要装置,其运行质量将直接影响到聚合产品的质量和整个生产过程的安全与稳定。采用间歇方式生产的特点是控制过程不具有连续性。保证聚合釜在工
演化硬件在自修复与容错系统、图像边缘检测、VLSI自动化设计和提高VLSI可靠性上得到广泛的应用,在军事、航空、航天领域具有重要意义,近年来,现场可编程门阵列(Field Programma
在新型干法水泥生产中,分解炉是预分解系统的核心设备,它承担着燃料燃烧、气固两相换热和碳酸盐分解任务。分解炉的稳定控制对于稳定回转窑的运行、稳定熟料质量具有重要的作
数据挖掘是高级数据分析工具,其任务包括频繁项集挖掘、关联规则挖掘、聚类、分类、特异数据挖掘、时间序列挖掘等。随着网络与计算机的发展,数据的形式更多样化,数量日益增大,这
现代工业对板带材的质量要求越来越高,因此对轧机的执行机构及控制系统性能提出了更高的要求。轧机自动厚度控制(Automatic Gauge Control,简称AGC)系统是现代化的轧机设备的核