【摘 要】
:
近年来,随着WEB3.0的飞速发展,社交媒体也迅速发展起来,各大社交平台竞相怒放,用户量迅猛增长。截至2016年11月,Facebook注册用户数超过14亿,Twitter月活跃用户数已达到3.1亿
论文部分内容阅读
近年来,随着WEB3.0的飞速发展,社交媒体也迅速发展起来,各大社交平台竞相怒放,用户量迅猛增长。截至2016年11月,Facebook注册用户数超过14亿,Twitter月活跃用户数已达到3.1亿,国内的新浪微博月活跃用户数也超过2.6亿。大量的活跃用户,每天自发的贡献,提取,创造,传播新闻资讯,使得每天有上亿条微博信息在各个平台上发布和传播。庞大用户群、海量文本信息吸引了越来越多的学者的关注与研究。事件检测与跟踪是一项旨在基于事件对信息进行分析和利用的研究。目前,国内外针对社交媒体的事件检测与跟踪研究成果较少。并且,社交媒体信息有文本短,信息不集中,网络用语多,口语化等特点,传统话题检测与跟踪方法用于社交媒体准确率很低。本文针对以上问题,提出了一种融合基于LDA浅层学习特征和基于Word2Vec深度学习特征的分类方法对新浪微博进行事件检测,并在事件检测基础上进行了事件热度预测与情感倾向性分析。本文以新浪微博为主要研究对象,构建了连续时间跨度超过两个月的语料库。通过融合基于LDA浅层学习特征和基于Word2Vec深度学习特征,使用随机森林算法对融合特征进行分类,可以获得微博条目的事件标签。我们对事件分类后的结果,利用微博的转发数,评论数,点赞数,是否是大V发布等参数以及历史热度信息,构建线性回归模型,对事件热度进行计算与预测。并提出了基于评价对象期望的情感倾向性分析方法来对事件的情感倾向性进行评判。为了验证算法的有效性,本文使用我们构建的语料库进行了实验验证并设置了对比实验,实验结果表明,本文算法具有优越的性能。
其他文献
MIMO和OFDMA等5G移动通信技术快速发展,正逐渐被应用于高速移动场景中,而且随着视频流等海量数据迅猛增加,高速铁路乘客对数据传输速率、网络服务质量等需求也日益增加。因此
在互联网高速发展的今天,电子商务迅速崛起,人们的消费观念由日常的普通市场开始向网络购物转变。网络购物给人们的日常生活带来了极大方便,提高了人们的生活质量。但是,信息量巨
协作分集技术是一项对抗多径衰落的有效技术,指单天线移动终端通过相互间的协作形成空域分集。机会中继(opportunistic relay-OPR)协作系统则通过选择一个最合适的协作伙伴参
随着网络和多媒体技术的发展,视频分享网站中网络视频数量呈爆炸式增长,用户对视频检索需求越来越高,因此网络上图像视频检索成为重要的研究课题。图像视频检索当前有三种方
由于C2C(Consumer to Consumer)电子商务交易的匿名性、动态性,交易双方缺乏基本的信任基础,交易存在较大的风险。构造科学的信任计算模型,客观度量卖家的可信度,辅助买家(消费者)做
随着现代社会的快速发展,各行各业对安防报警系统的需求也是与日俱增,并对智能视频监控系统中的应用技术及其发展提出了更高的要求。运动目标检测跟踪与行为检测技术作为智能视
随着业务流程管理的发展,业务流程建模成为业务流程管理研究领域的一个重要方面。业务流程建模是指通过图形、公式、表格或文字来描述业务流程的特性,将实际的业务流程转化为
云计算是一种新兴的计算模型,也是目前国内外商业和科研机构研究的热点之一。虚拟化技术是云计算中的一个重要特点。在云计算环境下,虚拟技术将网络中的服务器、存储和网络等虚
融合了无线局域网和Ad hoc网络优势的无线Mesh网络,作为一种解决无线接入“最后一公里”问题的关键技术受到了越来越广泛的关注。由于无线Mesh网络中的带宽资源和信道资源是无
分子动力学模拟是一种微观领域的模拟方法,在物理、化学、生物及材料等领域应用广泛。由于分子动力学模拟的计算量非常庞大,计算非常耗时,并行计算是解决该问题的必经之路。然而