论文部分内容阅读
人们越来越倾向于网上购物这种消费方式,在购买产品或服务前,人们通常会浏览相关评论以作参考。不良商店或用户为控制舆论导向从而发表虚假评论进行刻意吹捧或诋毁,以致大量存在的虚假评论误导消费者做出风险性的购买决策,严重扰乱了电商市场的平衡。现有的虚假评论识别方法在面对日益复杂难辨的虚假评论时,面临严峻挑战,因此对虚假评论进行识别具有重要研究意义。针对已有虚假评论识别方法中,没有考虑有效评论数据集和计算评论虚假度得分指标时未体现特征重要性等问题,提出了基于图模型的虚假评论识别方法。首先采用基于评分行为的异常对象检测方法筛选原始评论数据集中存在的异常对象,然后运用基于元路径特征权重计算的虚假评论识别算法识别筛选出的异常对象评论数据集中存在的虚假评论。针对异常对象的检测,从评分行为出发分析了处于不同异常评分行为下的异常对象,设计了基于等级评分差异和基于核密度估计的异常对象检测算法;针对虚假评论的识别,提出了基于元路径特征权重计算的虚假评论识别算法FRDA(Fake Review Detection Algorithm based on Feature Weight Calculation of Meta-path),将异常对象评论数据集构建成评论异构信息网络图模型,采用图模型的分类方法识别虚假评论,有效解决了虚假评论的总体稀疏性、不平衡性和计算评论虚假度得分指标时特征权重缺失等问题。在真实Yelp评论数据集上对所提出的FRDA算法进行实验验证,并与SpEagle及ICF算法对比分析,实验结果表明,FRDA算法在虚假评论识别准确率方面具有更好的表现。