基于图聚类的虚假评论人群组检测算法研究

来源 :沈阳理工大学 | 被引量 : 5次 | 上传用户:ahmat716
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,互联网已经融入了我们生活中的方方面面。评论系统是以此为背景发展起来的一个新兴产物,其广泛应用于各大社交网站,电子商务平台,以及论坛,贴吧等互联网应用中。尤其在电子商务领域,由于网络的虚拟性以及用户对所购买的产品无法直观的去感受等原因,评论系统中其他用户对于产品的评论是其他顾客在选购产品时重要的参考依据。很多不良商家出于个人利益的原因,雇佣虚假评论人对其销售的产品进行夸大性的评论,或者雇佣虚假评论人对其竞争对手进行诋毁性的评论。虚假评论问题的出现,大大推进了针对此方面的研究。国内外诸多研究人员针对此问题从不同角度,采用不同方法对此问题进行了诸多研究。本文针对此问题提出了一个基于图聚类思想的虚假评论人群组检测算法。本文认为仅从单个评论人的角度来发现虚假评论人其准确性以及效率是相当低的。只要虚假评论人在其评论过程中刻意模仿正常评论人的行为或者进行群组的虚假评论,则此类评论人则不易发现。本文提出的算法善于发现隐藏较深的虚假评论人和合作倾向的虚假评论人群组。本文针对评论人之间的相似度提出了从属性和结构两方面考虑的相似度计算公式,并且认为真正的虚假评论人群组应该是组内联系紧密的一个小团体,故在虚假评论人群组建立的时候利用双连通技术对其组内紧密度进行了严格的约束。在后续聚类阶段采用模糊图分割技术,针对图分割技术在图聚类中的诸多问题结合我们的应用场景对其进行了解决。在最终的实验环节,本文针对虚假评论人群组检测的特性,提出了若干针对虚假评论人群组的人工评估特征,并利用这些特征对算法中的结果进行了人工的检验。同时在相同数据集下从本文算法计算出的结果中抽取500个虚假评论人群组与其他算法计算出的500名虚假评论人群组进行准确率方面的比较,进而验证我们算法在准确率方面的优势。
其他文献
随着室外视频监控系统的广泛应用,面对海量的实时视频数据,人们不仅需要有效管理,还需要能够实时自动从中提取出运动目标的信息,实现室外监控视频系统的智能化。行人异常行为
在无线传感器网络(Wireless Sensor Network,WSN)中,定位技术使网络能够确定各个节点的坐标,从而确定事件发生的位置,使网络做出有效地行动,是WSN核心技术之一。其中,基于测
生物信息学是研究对生物数据进行获取、存储、分析等多个方面的一门综合性学科,是生命科学研究的重要组成部分。基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物
随着全球一体化进程的不断加快,国际贸易的日益繁荣,世界主要港口的集装箱吞吐量迅猛增长。海关作为国家进出境监督管理机关,需要实现新形势下对进出境集装箱的有效监管,尤其是转
词语搭配是具有一定语法和语义结构关系的词语组合,在句法分析、机器翻译等领域,发挥着重要作用。然而,仅对自然语言进行词法、句法分析已不能满足语义检索等深层自然语言处
数字矿山是在矿山领域内以三维坐标信息,及其相互关系为基础组成的一个信息框架,并在该框架内嵌入我们所获得的信息的总称。其中矿山三维建模与可视化是实现数字化采矿的关键
人脸图像检索技术由于它在身份识别、电子商务,金融安全等方面具有巨大应用前景而成为当前模式识别和人工智能等领域的一个研究热点。人脸图像检索技术包括:人脸检测技术、人脸
红外光图像和可见光图像表现的是图像不同频段的特征,为了增强机器的理解能力,以及人与机器的交互作用。图像融合具有重要的意义。世界范围内生产力水平不断的提高,科技有了
物联网是近年来逐渐兴起的一个概念,它通过各种传感设备和网络将现实世界中的人和物联系起来。由于设备的普遍存在性和其具有的感知目标能力,使得它非常适合对目标进行跟踪。
复杂网络社团结构的研究为人类发现更多实际意义的社团提供了更多的借鉴。本文主要研究了复杂网络的社团结构探测算法,通过对已有算法的学习和研究,改进了一种基于K-means的