基于论辩的用户评论质量预测方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yaczxxzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,越来越多的用户在电商平台上进行消费。作为用户消费时重要的决策依据,用户消费后反馈的用户评论在快速增长。海量的用户评论导致用户评论的质量参差不齐,给用户获取有价值的消息带来了巨大的挑战。因此,自动地对用户评论质量进行预测显得格外重要。关于自动预测用户评论质量问题,现有的方法主要聚焦于评论文本中的词法句法等信息,没有利用评论文本中富含的推理论证信息。这些与评论的逻辑、推理和说服力高度相关的信息对评论的质量有着直接的影响。因此,本文尝试对评论文本中的这些推理论证信息进行建模,探究其对用户评论质量的预测是否有所影响。  计算论辩是探究人类语言中推理论证等建模及计算的一个研究方向。论辩是指文本中含有的推理论证相关的信息。为了探究评论文本中论辩信息对于评论质量预测的影响,本文提出了基于论辩的用户评论质量预测方法,首次通过论辩来建模评论中的推理论证信息,进而将其应用到评论的质量预测中。为了探究基于论辩方法的效果,本文人工地构造了一个基于论辩的用户评论语料库。基于此语料库,本文改进了现有的论辩结构模型并设计了四种不同的论辩特征。为了对比基于论辩的方法和现有主流的各种方法的预测性能,本文在语料库上进行了各种方法的十折交叉验证实验。实验结果表明结合本文提出的基于论辩的方法,现有的各种方法的预测性能都有了显著的提升。这表明评论文本中的论辩信息对评论质量预测有着积极的影响。本文提出的基于论辩的方法可以有效地填补现有工作中对评论文本中推理论证信息利用的空白。
其他文献
在自然科学、社会科学和工程技术的很多领域中,人们都不同程度地要面对不确定性和不完备信息的处理问题。数据是信息的载体,由于数据采集过程中各种因素的干扰或数据存储介质
中科院“十一五”信息化建设将建成一个海量的科学数据应用环境。如何对这些海量科学数据进行整合,设计一种有效便捷的资源发现手段,为科研工作者提供统一检索入口,使用户可以便
近年来,DNA计算已经成为了科学家关注的热点研究领域。随着分子计算、DNA纳米技术和信息科学等多领域的日益交融,DNA计算及其相关研究都得到了快速发展。科学家设计和构建了多
学位
红外成像辐射计能够获得目标的形状并获得对象的光谱信息,目前已经被广泛应用到社会生活各个领域,已越来越受到人们重视。红外成像辐射计在使用前需对其进行辐射定标,红外成
学位
Radio Frequency Identification(RFID)射频识别技术,作为一种快速、实时、准确采集与处理信息的高新技术和信息标准化的基础,被列为二十一世纪十大重要技术之一。作为通过对
学位
多目标跟踪技术被广泛应用于战场监视和精确制导等军事领域,同时在民用领域也有十分广泛的应用,如视频跟踪,空中交通管制等。特别是对数目不定、运动剧变的多目标进行实时有
学位
高分辨率遥感影像中的阴影主要是高大建筑物、树木、山脉等对太阳光线的遮挡,在相应位置的影像内产生较暗的区域,阴影区域内的地物在遥感影像上表现为信息量较少,难以判读。阴影
网络测量是及时了解网络运行状态、检测网络拥塞、提供接入控制参考依据及保证网络服务质量的基础和必要手段。端到端可用带宽的信息作为网络测量的重要参数之一,其相关测量算
随着计算机网络的快速发展,网络设备的硬件处理速度越来越快,网络性能不断提高。与此同时大规模网络应用对网络的需求和依赖也在不断提高,例如大规模E-science产生的海量数据需
随着软件应用的日益广泛及其重要性的不断增加,人们对软件质量的要求也越来越高。软件可靠性模型作为可靠性评测的核心和关键,可用于软件生命周期的不同阶段,定量地估计和预