论文部分内容阅读
当今时代,网络舆论已经成为政府相关管理部门了解民意的重要通道。我国互联网正运行在高速发展的轨道上,新媒体、大数据等技术的崛起为全社会话语权空间开拓了新天地,为民众更多、更好、更快的表达所思所愿、参政议政提供了平台和支撑。2016年6月20日,在全国宣传思想工作会议上,习总书记强调:“网络舆论中既有理性的也有情绪化的,既有真实的也有虚假的,既有建设性的也有别有用心的。如果不对其作出准确判断,就难以掌握舆论引导的‘度’”。面对由社会热点事件、公共政策等引发的网络舆论动辄上亿的讨论量,如何从舆论大数据中去伪求真,获取“真”民意尤为重要。当前我国网民的素质参差不齐,网络舆论中既包含情绪发泄,也包含理性成熟的观点意见。习总书记在新网络舆论观中指出:“对网上那些出于善意的批评,对互联网监督,不论是对党和政府工作提的还是对领导干部个人提的,不论是和风细雨的还是忠言逆耳的,我们不仅要欢迎,而且要认真研究和吸取”。面对多维度的网络舆论表现,如何获取对管理决策制定有帮助的观点意见具有重大意义。 大数据的研究扩展了网络舆论分析的技术和方法,网络舆论中关于趋势分析、走向预测等隶属于基于舆论数量的研究,然而,数量只是事物表现的一个维度,另一个重要的维度是质量。当前,经济发展、环境治理、城市建设等与国家命运息息相关的领域都以“大质量”观为出发点。网络舆论的研究既应重视数量也应重视质量,在纷繁复杂的舆论大数据中寻找高质量的网络舆论是对新网络舆论观的践行,同时也为国家相关政策的制定提供依据。 本文以网络舆论为研究对象,创新性的提出了网络舆论质量的概念和内涵,从网络舆论主体成熟度、网络舆论客体真实度和网络舆论本体包容度三个维度建立网络舆论质量评价体系。基于对网络舆论噪声理论的研究,首次利用超网络模型对网络舆论中“噪声”元素进行识别,同时采用实证研究等方法证明模型的准确性。本文的具体工作如下: 1、创新性的提出“网络舆论质量”的概念。在全面梳理总结网络舆论相关研究基础上,参考经济和社会领域中不同质量的概念表述,结合网络舆论构成要素,将网络舆论质量定义为是网络舆论主体成熟度、网络舆论客体真实度、网络舆论本体包容度的综合性体现,是对网络舆论信息是否具有决策价值的评价。在“三个度”内涵解析的基础上,结合舆论噪声理论,借鉴“信噪比”的思想,理清网络舆论主体、客体、本体中存在的“噪声”元素,将有效识别其中的“噪声”元素作为网络舆论质量的三维评价手段。 2、首次引入超网络模型作为特征提取方法。通过对舆论超网络模型中环境、主体、心理、观点四层子网络的研究,结合模式识别问题,本文提出了基于超网络的舆论特征提取方法,包括两大特征集:其一,在每一层子网中分别提取节点表征的基本特征和连边表征的关联特征;其二,利用超边的性质提出超网络特征集。同时,根据实际问题的需要,所构建的超网络结构以及特征提取的侧重点可适当予以调整。将超网络模型作为舆论特征提取的方法是本文的一次创新性的尝试,同时,这种方法可以推广至其他领域的特征提取问题的研究中。基于此,本文也提出了具有范式意义的基于超网论理论的特征提取步骤。 3、构建网络舆论“噪声”超网络识别模型。以网络舆论质量三维评价体系为理论基础,通过对舆论超网络模型节点和连边的改变和重构,分别提出了网络舆论主体“噪声”超网络识别模型(Agent-Noise Detection Supernetwork model)、网络舆论客体“噪声”超网络识别模型(Event-Noise Detection Supernetwork model)、网络舆论本体“噪声”超网络识别模型(Opinion-Noise Detection Supernetwork model): (1)网络舆论主体“噪声”是指受某种利益或者目的驱使发布网络舆论的“非成熟”主体。在给出其表现形式的基础上,构建包括社交子网、信息子网、心理子网和负词子网的网络舆论主体“噪声”超网络识别模型。基于四层子网提取包含信息传播深度、信息传播广度、聚类系数等9个特征指标。利用机器学习分类算法实现对主体“噪声”的识别。 (2)网络舆论客体“噪声”是指网络舆论事件传播过程中出现的虚假信息。在给出其表现形式的基础上,构建包括社交子网、心理子网、关键词子网的网络舆论客体“噪声”超网络识别模型。基于三层子网提取两组特征簇,共包含29个指标。并针对有意传播者和无意传播者制定了两步识别机制。 (3)网络舆论本体“噪声”是指无法对管理决策的制定提供意见和建议的舆论观点。在给出其表现形式的基础上,构建包括环境子网、情绪子网、社交子网和内容子网的网络舆论本体“噪声”超网络识别模型,基于网络结构提取17个特征指标。利用机器学习分类算法实现对高质量舆论观点的提取。 以上三个模型的构建均是利用相应“噪声”元素的特征,对舆论超网络的子网结构、节点表征、连边属性进行重新定义得到的。针对每一种算法,本文均利用不同的案例进行实证分析,进而证明了算法的有效性和准确性。 4、基于真实案例实现网络舆论质量的综合性评价。基于“新浪微博”平台,以2017年全国两会相关议题的部分网络舆论为研究对象,实现对特定网络舆论内容的综合性评价,包括主体质量评价,关注的是特定微博评论区中非正常的网民(网络水军等)的识别;客体质量评价,关注的是政协提案相关的虚假信息识别;本体质量评价,关注的是普通民众针对两会相关报道的高质量舆论发帖的识别。结果显示,2017年全国两会网络舆论中不乏高质量的舆论信息,一些网民针对个别提案和政策提出了有效的建议和意见,舆论整体上呈现较为和谐、理性和高质量的态势,这与我国加大网络舆论治理力度有关。然而一些诸如网络水军、网络谣言等“噪声”因素仍然存在,仍需要不断的加强网络舆论监测、识别和引导工作。同时,本文对2018年全国两会舆论信息进行抓取,以期确保全国两会网络舆论质量评价工作的持续性。 综上所述,本论文以舆论大数据为研究背景,提出网络舆论质量的概念和内涵,借鉴“信噪比”的思想和理论,构建基于超网络模型的网络舆论质量三维评价体系,采用定性定量结合、实证仿真融合的研究方法,力争在网络舆论大数据中挖掘具有决策价值的信息。同时,在论文最后,本文针对该领域未来研究方向从理论、方法、数据集和平台四个方面提出了一系列展望。