微博舆情可视化系统的研究与实现

来源 :江苏大学 | 被引量 : 11次 | 上传用户:cheng1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,“宽带中国”等战略的持续深入实施,网络媒体已成为信息传播的主要渠道,其对社会舆论导向的影响力也日益显著。微博带来便捷的同时,也正在成为虚假信息滋生和泛滥的温床,因此,对微博舆情进行分析、监控就有着重要的现实意义。随着微博用户的爆炸式增长,其信息数量呈指数级递增,传统形式对微博舆情分析结果的展现已逐渐不能满足实际需要。本文从舆情分析结果展现的视点,分析了当前微博舆情可视化领域的相关研究工作,在研究微博舆情的图形化展示方式的基础上,提出了一种对当前微博舆情概况的可视化表现形式,基于提出的可视化表现形式,完成了微博舆情可视化原型系统的设计与实现。本文的主要工作内容如下:(1)对当前微博舆情可视化领域的分析与研究,提出并基于D3.js可视化库实现了一种微博舆情概况的图形表现形式,对当前微博舆情热点话题、热点话题的关注度、热点话题的用户情感倾向、热点话题之间的潜在可能关联四项数据进行直观展示。(2)在微博文本预处理过程中,通过调用NLPIR中文分词系统的API实现了对微博文本进行中文分词、词性标注等工作,并根据词性、长度、内容对分词结果进行过滤,得到了微博文本的VSM(向量空间模型)表示。(3)在微博舆情分析的话题发现过程中,基于知网(How Net)的体系结构,对于微博文本的语义相似度进行计算,度量微博文本间的语义距离,进而以此进行Single-Pass聚类分析,获得了微博舆情热点话题;基于知网(HowNet)发布的情感分析用词语集beta版,构建情感词典,通过情感词典对微博热点话题进行了情感值计算。(4)研究了舆情分析过程中的关键内容,对微博舆情可视化系统进行了详细的分析与设计。基于提出的微博舆情概况可视化形式对微博舆情可视化原型系统进行了实现,该原型通过对输入的微博文本数据集进行微博舆情分析,可视化展现了该数据集包含的微博舆情概况图像。
其他文献
一直以来肿瘤干细胞(cancer stem cells,CSCs)被认为是导致肿瘤发生、复发和转移的源头。研究显示,CSCs中线粒体结构形态的改变、信号通路的异常激活、线粒体功能紊乱、活性
发展是人类永恒的主题。十三届四中全会以来,江泽民牢牢把握这个时代的主题,提出了"发展是党执政兴国的第一要务"的著名论断,为科学发展观的形成奠定了坚实的基础。江泽民提出
文章提出一种改进的遗传算法,并将之应用于FIR数字滤波器的设计优化中。采用频率采样法,结合改进遗传算法,得到滤波器过渡带的最佳采样值,并与传统设计方法进行频谱的仿真比
文章针对GRAVINER Mark6 OMD调试和维护管理困难等问题,分析其系统结构、新技术特点,并提出了管理与维护方法及失效时导致曲轴箱爆炸事故处理办法,对船舶机电调试及管理工作
本文通过对系统分析方法的定义,运用系统分析的步骤,寻找产地、销地数量较多的企业在运输过程中存在的问题,以企业物流成本最小化为目标,建立最优化线性模型,借助lingo编程,
地籍管理是土地管理中的核心内容,其数据的直接来源是地籍调查即权属调查和地籍测量;由于地籍调查的成果一经确认即具有法律效力,因此要求其数据成果必须做到格式规范、界址清楚,精度满足管理要求。本文以河北省宁晋县地籍调查为例,简述数字地籍测量的作业模式及经验教训。
清代最具觉醒意识、灵襟独抱的女词人吴藻在传统等级秩序的压抑下陷入了所适非偶、无情有恨的不幸婚姻,要求个性解放冲破传统束缚的她用词曲作品向严酷的制度发出了控诉和抗争
文章从高职人才培养目标出发,紧扣职业岗位任职要求,提出深层次开展校企合作,实施“引企入校”,建设“校中厂”具体举措。并形成“引企入校、三层递进、分段实施”的高职人才培养
文章以ERM理念为基础确立了评价指标,以情景意识和公司安全文化意识为依据对轮机长的综合素质进行分析。各个指标权重的确立是采用全方位专家调查问卷结合层次分析法,再利用