【摘 要】
:
得益于互联网的飞速发展,社交网络应用平台已经成为最大的舆情发酵中心,产生了大量反映社会舆论倾向的数据,这些数据文本立场明确、网络组织结构离散、内容特征稀疏,而现有舆情相关研究一般聚焦于文本情感、网络结构或用户属性。本文从立场群体出发,展开热点话题提取、文本立场检测和群体挖掘三方面研究以呈现舆情全貌,主要研究成果如下:第一、热点话题提取方法研究。现有方法不是操作流程繁琐,聚类与话题词提取任务分离,就
论文部分内容阅读
得益于互联网的飞速发展,社交网络应用平台已经成为最大的舆情发酵中心,产生了大量反映社会舆论倾向的数据,这些数据文本立场明确、网络组织结构离散、内容特征稀疏,而现有舆情相关研究一般聚焦于文本情感、网络结构或用户属性。本文从立场群体出发,展开热点话题提取、文本立场检测和群体挖掘三方面研究以呈现舆情全貌,主要研究成果如下:第一、热点话题提取方法研究。现有方法不是操作流程繁琐,聚类与话题词提取任务分离,就是求解复杂无法并行计算。本文提出基于神经主题模型的聚类方法,在变分自动编码器的基础上,结合词向量,以无监督的形式联合建模主题词提取和聚类任务,可同时输出文章类别以及各主题类别的主题词。比其父模型在主题词提取性能上有明显提升,且生成的同一类别文本向量更聚集。第二、文本立场检测方法研究。针对社交短文本特征稀疏、新词多、文本中未包含目标话题、立场与文本情绪不相关以及话题多样且多变等问题,设计了基于协同注意力与一致性学习的立场检测模型,首先通过引入RoBERTa获取文本编码,其次使用协同注意力机制增强短文本与目标话题序列之间的联系,最后运用一致性约束,让模型学习对所有话题立场分类都适用的本质特征。本模型仅使用一个分类器来同时预测多个话题,在NLPCC2016微博立场检测任务的公开数据集上取得了最新结果Favg为78.69%,超出原最佳方法近6%。第三、群体挖掘方法研究。将社交网络上的群体挖掘问题抽象建模为多属性视图节点聚类问题。为了应对复杂多样的网络结构,设计了一种基于多属性视图的深度聚类模型,首先根据内容相似的节点构建出特征图,与拓扑图一并输入,通过三层注意力机制自适应提取不同属性视图下的拓扑与节点自身内容特征,并从嵌入学习方向、扭曲程度、空间干扰程度三方面监督指导节点嵌入学习。综合实验表明,该方法学习到的嵌入更适用于聚类任务,且可以应对关系稀疏的节点,在多属性和单属性视图的四个开源数据集上同时取得了最新结果,与各数据集上的最佳基线方法相比,准确率平均提升了6%。最后基于上述三个算法,设计并实现了基于话题立场的群体挖掘原型系统,该系统可以提取并展示日常热点话题,生成话题演化脉络,自动识别统计网民对话题的立场倾向比例,展示持相同立场的群体挖掘结果,以辅助舆情管控。
其他文献
随着我国国民生活水平的不断提升,对3C电子产品的消费逐渐提高,促进了3C产业的繁荣发展。据公开数据显示,我国占据了全球3C产业70%的产能。人力成本是3C产品生产的主要成本之一,因此提高3C产品的自动化生产十分必要。在3C产品中有大量柔性线材的使用,然而柔性线材具有柔性高、变形难以控制、容易发生形变等特点,因此对其实现自动化操作较为困难。为此本文对3C产品中柔性线材的自动化操作开展了相关的研究工作
随着计算机行业的快速发展以及各种图像采集设备质量的迅速提升,商业摄影的人像美化受到广泛关注。目前,人像摄影图像后期处理仍主要依靠人工完成,其精修过程需要耗费大量时间和精力。因此,开发一款面向商业人像摄影的自动后期修饰软件具有十分重要的理论意义和应用价值。现有的人像美化软件大多面向移动端拍摄的图像,当其应用于摄影图像时会使皮肤区域过于平滑而失去质感,对背景颜色和细节也有一定程度的破坏。本课题借助深度
在农业生产当中,除草一直是一个非常影响作物产量的重要工作,现有的机械除草、化学除草等除草手段存在着非常消耗人力、对环境污染较大等各种问题。因此,在现代化的智慧农业生产当中,如何更加高效环保地进行除草一直是一个非常重要的研究课题。基于深度学习的计算机视觉技术的发展使得农田中的杂草识别定位变得更加精准,推动了机器智能除草的快速发展。基于自动识别定位杂草的机器智能除草技术能够自动按需喷洒农药,在解放人力
自改革开放以来,中国经济迅速腾飞,其中离不开制造业的迅速发展。目前我国制造业已经形成了门类齐全、独立完整的产业体系,但与世界发达国家先进制造业水平相比,仍然具有很大的距离,究其原因是中国制造业创新能力偏低。随着中国经济逐步迈入“新常态”,对我国经济发展质量提出了更高的要求,为此国家提出了“中国制造2025”战略,对于制造业企业来讲,进行制造业的创新与产业升级、构建制造业“国内国际双循环”的新发展格
目标辐射源定位技术在当今世界的电子信息战中扮演着重要的角色,在超视距目标探测领域,短波目标辐射源精确的位置信息具有举足轻重的地位。随着信息技术的不断发展,电磁环境逐渐变得复杂多变,军用雷达对于定位精度的要求越来越高。传统的短波目标辐射源定位方法大多是基于两步法的,此类方法的计算复杂度相对较低,因此适用于实际工程应用。但其也存在一些局限性,此类方法忽略了接收数据的内部联系,在第一步提取相关参数的过程
在全球范围内,肺癌正逐渐成为癌症致死的主要原因。大多数肺癌是由恶性结节引起的,肺癌早期诊断需要在胸部CT(Computed Tomography)图像中查找肺结节。近年来,计算机辅助诊断方法成为人工智能领域和医疗图像领域研究的热点,在智慧医疗和快速诊断方面有着实际应用价值。本论文基于胸部CT图像针对肺结节辅助诊断方法进行研究,主要包括肺结节检测、肺结节分割和肺结节良恶性分类。本文具体研究内容如下:
随着《中国制造2025》规划和“十四五”国家重点研发计划颁布和实施,3D打印技术在航空航天、汽车制造、智能装备、生物医药等领域发挥的作用将进一步提升。熔融沉积式(FDM)3D打印技术作为3D打印技术应用最为广泛的形式之一,受到越来越多研究人员的关注。目前对FDM型3D打印喷头的研究中,对于挤出口尺寸可调节的喷嘴研究有限。挤出口尺寸固定的喷嘴在打印时需经过点—线—面—体成型,打印速度慢,打印效率低。
随着工业互联网的发展,世界各国正在围绕工业制造进行数字化革命,加速构建智能化生产、个性化定制和协同生产等特征的工业新生态。领域知识库作为一种特殊且常用的数据库,高效率地构建领域知识库是目前研究的主要难点。然而在以往的研究中,大多数学者忽略了本体所能表达的详细内容。领域知识是复杂多样的,通过现有的本体描述方法无法较好的展示领域知识。另外工业互联网是全新的工业生态。工业机理在工业生产中十分常见,是包含
企业可持续成长是引领中国经济高质量发展的关键。由于疫情爆发、新兴产业冲击、盲目转型等诸多原因,企业成长速度明显放缓。面对复杂严峻的国内外经济环境,企业亟需培育成长新动能。现有研究仍主要聚焦于传统工业时代内外部因素对企业成长的影响,忽视了数字经济时代下,数字技术应用在企业成长中发挥的重要作用。数字技术应用作为企业成长的新动能,对企业成长产生重要影响。数字技术应用能够加快企业对市场动态的反应,帮助企业