基于文本挖掘的“双减”政策下的微博评论情感分析

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wangzuyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业的不断发展以及网络覆盖率的逐步扩张,包含各种各样社会、娱乐的信息和新闻在网络社交媒体上广泛传播,其中不乏普通网民对国家新出台政策的看法等线上评论。而这些网络文本数据中包含着网友们对新出台政策的态度和展望。面对海量的在线评论文本数据,一条条地通读来了解网友的看法是很占用时间也是没有必要的,如果用文本挖掘的相关技术提炼出网友们对于某事件的主要观点以及主要关注点,并进而分析网民对此事件的情感倾向,更容易把握网民们对事件的整体看法。故本文基于中文文本挖掘的理论知识和相关技术,对“双减”政策相关的微博评论进行研究,挖掘广大网民朋友对“双减”政策出台的一些看法,基于机器学习算法和主题模型对评论文本进行分析和挖掘工作,对中文文本评论数据进行“提纯”,意在用最快最精准的方式提取出评论文本数据中最有价值的信息。同时,本文所做的研究也为通过应用中文文本挖掘技术来挖掘教育政策型线上评论文本的任务提供了一些可供参考的解决思路和方法。本文在分析实例中用到的文本挖掘相关方法主要有主题模型、文本分类模型、语义网络分析和统计词频的词云图绘制方法。首先利用爬虫技术得到“双减”政策热门微博下的评论文本,通过人工标签的方式将文本分为积极和消极两类评论。然后采用python工具对爬取的文本数据进行数据预处理,再利用jieba分词包对清洗后的文字数据进行中文分词,并计算词频,按积极消极情绪评论两类分别绘制词云图。利用词袋模型和TF-IDF模型对文本数据进行向量化处理,形成了“双减”政策微博评论数据集。本文用基于情感词典和传统机器学习算法的两种方法分别进行情感分类任务,并通过比较发现,SVM模型在该数据集上的分类效果最优。其中情感词典选用知网官方情感词典,机器学习算法选择了 KNN、Logistic回归、朴素贝叶斯分类器、随机森林和支持向量机五种常用的二分类模型。最后基于LDA主题模型和语义网络分析完成了对文本数据主题词的提取以及文本主题的分类,进而能够更直接地获取评论中的相关信息,进而分析网民们对于“双减”政策的情感倾向。
其他文献
目的:检验晨丹诗歌同化自愈疗法及其理论成果《汐月集——爱的缘起》的应用效果。方法:以《汐月集——爱的缘起》为应用工具,对34例诗歌诵读者的诵读效果进行基于扎根理论的质性分析。结果:两项分析的编码结构高度一致;核心编码中,效果维度包括问题解决和积极心理健康,是自愈效果的呈现;态度维度是对作者和诗集文本的认可程度;文本维度包括思想性、境界、生命状态、主题和语言特点,提供了对自愈效果的解释。结论:晨丹诗
<正> 随着化学工业的发展,对聚醚型多元醇(简称聚醚)需求量越来越多。它适用于酯类的乳化剂、净洗剂、增塑剂、润滑剂,可做为不饱和聚酯原料,以及纺织和医药的助剂。特别是近年来大量发展起来的聚氨酯新型材料,更增添了聚醚的运用的广泛性,且种类繁多。
期刊
读后续写是高中英语教学中广泛使用的一种教学模式,也是高中英语教学关注的重点内容之一。读后续写是阅读和写作的融合,是学生熟练运用英语专业知识和现实生活相联系的有效途径。文章阐述读后续写的概况,反思当前英语读写教学存在的问题,并提出语篇阅读教学中读后续写的教学建议。
依托“体育赛事+旅游”新兴产业模式发展壮大,本研究为推动裕固族传统体育赛事旅游资源开发、打通裕固族地区体育旅游新通道、打造裕固族传统体育赛事战略品牌、促进裕固族地区“传统体育赛事+旅游”发展,基于梳理裕固族传统体育赛事与当地旅游融合概念和内涵的基础上,以“方法论”——扎根理论作为裕固族传统体育赛事与旅游融合动力机制研究的主要研究方法,通过三种编码形式:开放性编码、主轴编码、选择性编码,自上而下对访
读后续写已成为我国高考英语写作的重要题型,体现英语学科核心素养的关键点,即在问题情境中分析问题和解决问题的能力。过程写作法有别于只注重结果的传统教学法,在读后续写教学中使用过程写作法能提高学生写作兴趣和写作水平。以一节教学设计,演绎如何在读后续写教学中引入过程写作法,使写作过程形成双向交流模式,促进学生的分析问题和解决问题的思维能力以及写作表达能力逐步完善发展。同时,借助“一文三写”教学模式帮助学
从单篇到群文,语文阅读教学面临重要变革,教师要正视群文阅读的可行性、科学性、先进性,从单篇教学走出来,对群文阅读做教学研究,推出更多群文阅读教学模式,让学生自然进入到群文学习环节,在深入阅读和思考中提升学科核心素养。群文阅读不只是增加阅读量,也不是简单的叠加教学,需要从单篇阅读中进行迁移,利用统合式、融合性教学机制,推进群文阅读教学顺利开展,让学生在深度阅读学习中完成认知构建。
乳糜漏是腹腔镜下根治性肾切除术后少见的并发症,首选保守治疗。本文报道1例通过中西医结合治疗本病且成功闭漏的患者,并通过回顾国内外相关文献,复习了外科术后乳糜漏的治疗进展,总结了本病的中西医治疗策略,以期为该病的临床诊疗提供经验和帮助。
文章分析了中华学术外译项目实施的整体状况、出版规律和特征,展现了该项目的立项内容结构、不同语种间的主题偏好、各语种间的主题结构差异以及所涉学科数量和语种的发展趋势,探讨了中华学术外译项目未来可能的优化路径,为进一步推动新时期中国学术外译高质量发展和国际传播能力提升提供参考。
读后续写有助于培养学生的思维品质,教师要遵循新课程标准的理念,采用恰当的教学策略,以2021年全国新高考I卷英语读后续写题为例,阐述了通过培养主题意识,解码主旨大意;逆推情节发展,发展思维品质;关注语言协同,聚焦语用能力,旨在提高读后续写能力,促进思维品质提升。
高中英语读后续写突出对学生思维品质的考查,准确的情节构思直接决定了续写的成功与否。从思维品质的视角出发,结合现有研究理论与教学实践经验,提出读后续写的情节构思策略,并通过具体案例展开说明,旨在为读后续写教学指导提供新的视角,从而提高学生情节构思的准确度。