论文部分内容阅读
随着互联网技术飞速发展,网络舆情的信息量迅速增长,影响力不断增大,正确把握好海量网络舆情动向对维护企业的形象以及决策至关重要。从网络上采集海量的舆情信息,挖掘出网络舆情的正负面情感倾向,提供舆情统计报告,能够帮助企业科学判断企业的形象存在的危机,及时的维护企业形象和提供决策支持。针对上述的情况,本文建立了基于Hadoop的舆情分析系统,利用Hadoop平台实现海量网络舆情信息的存储、处理和情感倾向统计等,为企业的提供了智能化的舆情分析服务。本课题从舆情分析系统的研究背景和现状出发,确定在系统中引入Hadoop技术;对网络爬虫技术、情感分析技术和Hadoop技术进行深入研究,为舆情系统的实现奠定了理论基础;通过调研和需求分析,确定了需求;并设计了企业舆情分析系统的总体架构,并对Hbase数据库表和字段设计进行了详细的说明;系统具有存储和处理大数据的能力,通过Map Reduce技术进行处理,实现了系统的良好可视化界面;用户从系统的需求分析出发,针对需求分析对系统进行了全面的测试。本课题通过采用一系列的关键技术,实现了基于Hadoop的舆情分析系统;针对系统的需求设计测试用例,针对系统进行了全面的测试,验证了系统各有效性和可靠性;系统的展示界面能够人机交互,能够展示各个企业的情感统计、Top10热词、用户情感趋势、关注度趋势等;基于Hadoop的舆情分析系统支持对海量数据的存储和处理,能够为企业提供舆情分析图表报告。