社交网络下的垃圾信息处理算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:chenshunsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着Web2.0的发展,社交网络在人们的生活中扮演了越来越重要的角色,如今主流的社交网络平台有新浪微博、百度知道、微信、QQ、一直播、知乎、豆瓣等,同时,随着手机等通讯工具的普及,为人们随时随地通过网络进行网上阅览、分享信息、互动提供了便利。然而,正是这种便利性,催生了一大批垃圾用户,这些用户在平台上发布恶意链接、推广虚假广告、恣意中伤他人、传播各类谣言等等,严重影响了用户体验,给人们的生活带来了困扰,其消极影响愈加显著。因此,如何识别并检测这些恶意用户、屏蔽垃圾内容,成为当下研究的热点问题。本文选取了时下主流的社交平台——新浪微博,以及知识共享平台——百度知道,利用机器学习技术以及排序思想分别对两个平台的垃圾信息进行处理,设计了针对微博的垃圾信息检测算法以及针对百度知道的隐性垃圾答案沉降算法。本文的主要内容如下:首先,介绍了社交网络的定义发展以及常见的网络中的垃圾信息问题,分别针对微博和问答网站进行了垃圾问题概述,包括垃圾信息的分类、处理技术。其次,针对微博中的垃圾信息,提出了基于颜色的可视化垃圾行为特征提取和基于词项黑名单的垃圾内容特征提取,同时,在这两种特征集合的基础上,提出了基于贝叶斯网络的垃圾信息检测算法。实验证明,基于贝叶斯网络的垃圾信息处理算法分类结果要优于朴素贝叶斯算法,同时优于分别针对垃圾行为和垃圾内容检测的算法。最后,针对问答网站中的垃圾信息,先将垃圾答案分为显性和隐性,对较难用技术手段分类的隐性垃圾答案提出了沉降算法,引用物理学物体下落的思想,结果证明,该算法能够有效地将垃圾答案沉到答案序列的底端。
其他文献
设施布置问题的优化研究广泛存在于制造企业中,在实际的应用中,设施布置的优劣严重影响着企业的生产成本与效率。随着经济技术、经济全球化的发展以及全球化市场环境的全面形成
北京宝洁技术有限公司是美国在华独资的14家分公司之一,50多名员工都是具有博士、硕士学位和大学本科学历的专业技术人员。1997年10月在海淀试验区党工委的帮助下成立了党支
Robonova-I是高性能的仿人形机器人,主要用于教学、竞赛与娱乐等领域。Robonova-I除了可以用脚走路外,更可以表现各种高难度的仿人动作,可实现跑步,翻跟头(侧翻、前滚翻、后
当前,正值全省上下贯彻党的十五大精神,认真落实省第八次党代会精神的大好时机,根据中央安排,我省又作为第一批开展“三讲”教育的单位,我们一定要抓住这一有利时机,搞好“
在一次同学聚会上,有位多年没见过面的高中同学郑重地递给我一张名片,上面除了印有姓名、工作单位、联系电话之外,还赫然印着“中共党员”四个烫金字。老同学是在一家基层信
每当谈到学生语文素养的培养,一个具有东方文化特质的字——“悟”,便会浮现在我的脑海里。悟是什么?悟是主体通过感受、理解、体会而获得的一种能触类旁通的知觉或直觉,是主客体的交融、渗透与契合,是一种独特的认知方式和审美体验,通俗地说,就是心领神会。  就语文学习来说,悟是阅读主体对语言材料直觉的、整体的把握,是言语体悟与生命体验的融合。语言的领悟力是语文能力的核心。由于一直以来在教学中充斥着大量单调乏
期刊
封建社会的官吏常用微服私访的办法取证办案或体察民情。据说这一招很灵,兴师动众了解不到的真实情况,微服私访却能调查得一清二楚,水落石出。按理说,在大力提倡实事求是的
随着林业技术的发展,林业种植与管理正逐步从粗放经营向集约化经营过渡,林业种植的单位面积产量和质量也随之提高,这也成了当今世界林业发展的重要趋势之一。本文主要从速生杉木
参加这个活动,我心里面是有点忐忑不安的.今天这个活动有多重意义,有教学观摩,有研讨,还有纪念.纪念德高望重的著名语文教育大家于永正老师,但我今天讲的内容与今天活动的主
期刊
版面作为报纸各种内容编排布局的整体表现形式,它的作用越来越受到广大读者的关注。版面美是报纸版面编排中的具有广泛内涵的美学特征,从中挖掘具有芙感作用的各种因素,可以