基于评论关系的垃圾评论者识别研究

来源 :福州大学 | 被引量 : 1次 | 上传用户:moqianru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾评论者的检测无论是在推荐算法还是在观点挖掘中,都起到了重要的作用。现阶段,垃圾评论者的检测在国内外得到广泛的研究,并取得显著的成果。由于国内外基于评论关系图的垃圾评论者的研究中,并没有有效的考虑评论者之间的关系,以及未考虑融合评论内容特征和评论者关系的垃圾评论者检测方法。因此,本文以这两个特征展开了以下几个研究:(1)针对目前检测垃圾评论者的方法主要基于评论、评论者和商店之间的关系,而未结合评论者之间关系的问题,提出基于评论者关系多边图的垃圾评论者检测方法。该方法以每个评论者为节点,评论者间的支持关系为边,构建评论关系多边图模型。而后根据多边图模型,采用基于PageRank的评论者互评估可信度模型来检测垃圾评论者。最后,在Resellerrating.com和亚马逊数据集上的结果表明该模型能够更为有效的识别出垃圾评论者,在一定程度上解决了仅发表一条评论的评论者难识别的问题,与基准相比,准确率分别提升了 13%和14%。(2)针对基于PageRank的方法计算评论者互评估可信度的过程中存在垃圾评论者通过链接作弊方式提高自身排名的问题,提出了基于可信度传播的垃圾评论者检测方法。该方法首先构建了评论者关系图,其次同时考虑TrustRank和评论真实度构建了评论者可信度传播模型,通过使用该模型在评论关系图上随机游走的方法计算每个评论者的可信度。最后根据评论者的可信度检测垃圾评论者。通过两个数据集进行检验,实验结果表明与使用PageRank的评论者互评估方法相比,本方法的准确率在两个数据集上都提升了 2%。(3)针对基于评论者的可信度传播方法检测垃圾评论者的过程中未充分利用评论者的不可信度传播的问题,提出同时结合TrustRank和Anti-TrustRank的垃圾评论者检测方法。该方法首先在已构建的评论关系图上,再以每个评论者为节点,根据评论者之间的反对关系构造反对边,得到评论综合关系图。而后利用Anti-Trustrank算法和TrustRank算法分别在反对边上和支持边上进行随机游走,从而得到评论者的被传播可信度和不可信度。最后通过结合TrustRank和Anti-Trustrank的线性组合模型用于检测垃圾评论者。在两个数据集上的实验结果表明该模型与未结合不可信度传播模型的结果相比,准确率都提升了 2%,与基准相比,本方法准确率分别提升了 17%和18%。
其他文献
2009年以来,我国并购交易数量和规模都呈现不断增长的趋势。自2011年,中央“十二五”规划提出“加大兼并重组力度来引导产业升级和转型”之后,并购总量从2012年开始出现了爆
如今的室内无线定位技术受到搭建成本、定位精度、便捷性等因素的制约,致使目前还没有像室外卫星导航系统一样广泛应用的室内定位系统。现有的高精度室内无线定位系统对基础
在数字图像处理领域中,图像色彩传递技术是一个有挑战性的研究热点。图像色彩传递技术通常是指将特定的色彩模式赋予指定的图像的处理过程。本文在分析经典色彩传递算法的原
医用超声图像因其即时性、无损性、可重复性好和灵敏度高等优点,而广泛应用于临床治疗和诊断中。在需要提取特定组织器官的信息时,不可或缺的手段就是超声图像分割。通过对图
薄膜晶体管(TFT)作为薄膜晶体管液晶显示(TFT-LCD)和主动式有机电致发光显示(AM-OLED)的核心驱动元件一直被人们深入的研究。与技术成熟的TFT-LCD相比OLED采用电流驱动,固定
增强现实(Augmented Reality,简称AR)是一门新兴发展的虚实融合技术,主要通过对真实场景叠加虚拟物体实现图像信息增强,目前已在军事、医疗、工业和娱乐等领域展开深入研究。
《农业创新系统:投资手册》属于信息型文本。本书旨在提供一系列的农业创新发展和创新投资方式,以促进农业农村的创新发展和平等发展。因此,本次翻译的主要目的是传达本书讲
目标跟踪技术在人机交互、智能交通、视频监控等领域发挥着重要的作用,但由于场景的复杂性,还需要对该技术进行深入的研究。目标的姿态变化、外界光照变化、遮挡、高速运动等
卫星星间测距与卫星星间通信链路的建立和维持是卫星自主导航的关键技术之一。卫星星间链路信号具有很大的多普勒频移和传输时延不确定性,使得信号捕获的难度增加。但在实际
中小企业是我国经济发展的中坚力量。投资作为企业的重要活动,其效率影响着企业价值的提升和战略目标的实现。目前已有的对于非效率投资影响因素的研究多是从负债结构、负债