论文部分内容阅读
近年来,艾滋病患病人数不断增长,经研究发现通过MSM(男男性接触者)传播是其重要传播途径。为阻止传播,需要一种简单快捷的识别方式对MSM是否患病进行判断预警。当前,通过对目标人物情绪分析进行病情预警研究已成为医学和科技领域的热点。但是,由于目标人物的对话内容信息简单,数据量繁杂,信息判断效率低,根据语义不足以支撑对病情进行快速判断,需要一种快捷分类判断方式对病情进行预警,以便及时发现病患进行阻断。本文是情感分类在病情判断方面的技术应用。在基于对文本情感进行准确分类的基础上,对目标人物的艾滋病患病情况进行快速识别。为提高病情预警效率,缓解识别速度慢、准确率低等问题。本文结合情感分类算法与文本挖掘算法,对传统BERT(用于语言理解的深度双向预训练)算法进行改进,并且提出一种混合BERT算法。该算法对BERT的全连接层进行改进,寻找其最佳阈值来提高准确率的同时,结合文本挖掘KNN(K近邻法)的思想,对文本情感与关键字信息进行相应的权重计算,以达到对文本信息的多重提取的目的,从而实现根据文本信息发现病情并预警。在实验阶段,通过使用基于Python的混合BERT分类预警算法与其它算法进行对比实验,验证本文提出的混合BERT算法的优越性。本文主要研究内容分为三部分:第一,对情感分类流程进行研究,并对常用分类算法进行重点说明;第二,对情绪分类技术在病情判断方面进行研究,从基于深度学习和基于文本挖掘的两种处理方式进行论述探讨;第三,对本文所提出的混合BERT算法进行研究探讨,该算法继承BERT的准确高效,同时拥有基于情绪对病情分类的能力,故将其应用到根据文本短对话对艾滋病进行判断预警当中。实验表明,本文提出的混合BERT算法可以通过文本分析对目标人物的患病情况进行及时判断。这种通过情绪分类技术对艾滋病病情进行判断预警的方式,在医学诊断领域具有较高的参考应用价值。