【摘 要】
:
在过去的十几年,随着各种社交媒体的迅速发展,越来越多用户通过社交媒体发布大量与健康问题相关的信息,基于人工智能的方法研究这些信息取得了大量的成果,但也存在诸多挑战。一方面,通过公众发布的社交媒体数据,可以研究出他们对一些公共健康问题的态度,但这些通常都是无标注的,深度学习模型难以发挥优势,而大规模标注数据的代价又十分昂贵。另一方面,通过用户发布的隐含个人健康问题的信息,一些研究聚焦于潜在的抑郁、厌
论文部分内容阅读
在过去的十几年,随着各种社交媒体的迅速发展,越来越多用户通过社交媒体发布大量与健康问题相关的信息,基于人工智能的方法研究这些信息取得了大量的成果,但也存在诸多挑战。一方面,通过公众发布的社交媒体数据,可以研究出他们对一些公共健康问题的态度,但这些通常都是无标注的,深度学习模型难以发挥优势,而大规模标注数据的代价又十分昂贵。另一方面,通过用户发布的隐含个人健康问题的信息,一些研究聚焦于潜在的抑郁、厌食等精神健康问题的检测,为及时干预提供了支持。但现有的个人精神健康检测模型通常没有考虑数据类别不平衡对模型的影响,并且现有模型对融合领域知识进一步提升模型性能的研究也存在不足。针对相关标注数据集有限的问题,本文提出了三种基于迁移学习的公共健康问题的态度分析模型。一种是分别迁移静态词向量和动态词向量ELMo后,经双向门控循环神经网络和注意力机制进行处理。另两种是分别用少量标注的数据对预训练语言模型GPT和BERT进行微调。最后,三种模型在推特HPV数据集上的实验结果表明提出的三种基于迁移学习的模型在分析公众对HPV疫苗接种问题的态度中表现出色,并且微调BERT模型取得了最佳表现。针对现有个人精神健康检测模型训练时,未考虑到的数据类别不平衡以及领域知识的问题,本文提出了一种知识增强集成学习模型用于检测个人精神健康。首先通过向Daily Posts中相应位置注入匹配的三元组信息得到包含了先验知识的新Daily Posts,然后经BERT嵌入层、双向门控循环神经网络层和注意力层得到知识增强的基分类器。最后,通过Ada Boost集成学习算法对基分类器进行集成减轻数据类别不平衡的影响并得到最终的个人精神健康检测模型。该模型同时在RSDD抑郁检测任务以及CLEF e Risk 2018厌食检测任务中取得的最佳表现表明其在精神健康检测领域中具有一定的可实践性。
其他文献
知识图谱表示学习的目的是将知识图谱中的实体和关系嵌入到连续低维向量空间中,以便在保留知识图谱结构的同时提升下游机器学习任务的性能。但已有的知识表示学习方法大多仅将工作重心放在表示三元组中的结构化信息,而忽略了语义信息对于知识表示学习的重要性。本文将从关系层次结构和实体类型这两类语义信息入手并分别提出对应的知识表示学习方法。关系层次结构,是由关系间的泛化关系subRelation Of构建而成的结构
为了保护图像的信息安全,图像加密技术已经成为信息安全领域研究的重点问题。其中最具有代表性的技术是基于双随机相位编码(Double Random Phase Encoding,DRPE)的图像加密技术,该技术近年来得到了广泛发展。本文总结分析了基于DRPE的光学图像加密的一般框架,并在一般框架下提出新的加密技术。具体内容如下:(1)本文总结了基于DRPE光学图像加密技术的一般框架,一般框架由预处理操
分子成像技术的出现为生物体内肿瘤的无创可视化打开了大门,各类分子成像探针也在快速的被开发研究。一些成像探针在肿瘤成像方面表现出良好的成像效果,但其潜在的生物安全性难以预测,限制了其近一步的临床应用。基于蛋白质的成像探针由于具有良好的生物相容性、可灵活设计性和较好的成像效果而被广泛关注。本论文围绕基于蛋白质的成像探针的设计合成、性能及生物应用进行了一系列研究,主要研究工作归纳如下:第一章,主要介绍了
近年来,随着计算机视觉技术和计算机硬件的迅速发展,动作识别作为计算机视觉中的热门研究领域,已经在视频监控、人机交互、虚拟现实等领域得到了广泛的应用。目前,动作识别的研究主要集中在人类动作识别领域,除此之外,工程机械的动作识别也开始获得研究人员的关注。建筑行业管理人员可以通过工程机械的动作识别迅速掌握设备的施工信息,及时做出判断并采取应对措施,以达到提高生产效率、节约成本和节能减排的目的。但是在工程
随着大数据时代的到来,借助于海量的数据信息,具有复杂结构的深度神经网络以强大的特征学习和表达能力在计算机视觉领域超越了手工提取特征的传统方法。伴随着网络性能的提升,网络中参数数量也成倍的增长,这给在计算、存储等资源受限的硬件设备上部署模型带来了巨大的挑战。因此,将优秀的模型算法加载到端侧设备上运行,提升资源受限平台上深度神经网络的性能,有利于技术的落地,具有很大的应用价值。针对上述问题,本文提出了
向制造业学习过程中,制造业与建筑业的趋同性强化了建筑“产品”的概念。制造业先进理念技术逐步引入到建筑中,然而,应用的深度与角度存在一定的局限性。建筑工业化已成为设计建造的重要方向,但国内外研究中并没有对于“建筑产品化”的确切概念,通过文献研究法对比分析制造业产品与建筑异同,定义“建筑产品化”:以标准化为基础,通过模块化方法,提高各层级建筑产品通用化程度的建筑系列化过程。工程实践中,精益建造所提倡的
随着我国信息技术的发展,第三方检验检测行业越来越受国家和当地政府的重视,检验检测机构将开启一个全新的发展阶段。检验检测机构每天都会产生大量的检测数据,而传统的管理模式存在着效率低下、信息化薄弱、人工失误繁多、成本不受控制等因素的影响,制约了其发展。在检验检测机构的日常工作中,快速适应时代发展模式,优化工作流程,提高管理效率,从而提升检验检测能力,节约成本以及规避行业风险,这也是现今第三方检验检测机
在这个发展十分迅速的时代,汽车已经成为了必不可少的一个种交通工具,由于驾驶行为不当,造成的交通事故也越来越多。所以我们要对驾驶行为进行分析,讨论驾驶行为对驾驶员认知行为的影响,进而减少事故的发生。目前,对驾驶行为的定义还不是很准确,使用的方法也不尽相同,因此分析可能不够全面。在这项研究中,我们收集了新颖的数据语料库,包括驾驶数据和驾驶员的认知得分,以分析驾驶行为。我们从驾驶行为(例如:转向角,速度
安全管理是建筑领域在进行管理时重点关注的任务之一。现阶段,国家实力的进步带动了建筑业的快速发展,建筑领域也在不断向数字化迈进,但是因建筑施工所导致的事故以及人员死亡也在不断增加。为了能够减少施工事故的发生,更好地保护施工人员的身心健康,有必要加强对建筑施工事故报告的研究,并从中总结经验。在过去,建筑施工安全风险的总结,主要是通过相关人员从案例或相关领域知识中人工总结经验并形成一套安全管理办法。为了
随着我国经济的高速发展,对能源的依赖性也越来越强。近年来我国钻井技术不断发展,海上石油开采能力越发提高。海上石油开采不仅对开采设备的强度腐蚀性等方面拥有严格的要求,而且需要更高精度的传感器设备、传输系统和录井软件来采集和处理井下数据。目前我国的录井软件对国外的依赖性比较高,由于录井软件非常昂贵,每年需要支出大量外汇用于购买软件。并且引入软件很少提供中文的支持,普通的钻井操作人员使用难度较大。本文提