CrisisNLP-C:中文灾害数据集

来源 :华北科技学院学报 | 被引量 : 0次 | 上传用户:ERICAMBER
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当灾害发生时,人们经常使用微博、微信等社交媒体发布文本内容,描述伤亡人员、被困人员、车辆受损及基础设施损坏等情况。如果及时有效地处理这些在线信息,构建相应的机器学习模型,对应急响应组织进行态势感知、舆情应对或者救援活动极为有用。然而,目前对于社交媒体信息的有效处理仍存在众多挑战,比如准确分类这些简短和非正式的文本数据。从根本上讲,这些任务均涉及到数据样本问题,特别是国内目前还缺乏人工标注的中文灾害数据。为此,论文收集了2018年发生的与3起自然灾害相关的微博文本数据,并按照多层级分类方法进行了人工标注。该
其他文献
食用油厂在制取和加工过程中产生的废水符合规定的排放标准后方可直接排放,而企业可选择合适的处理工艺和处理设施工业废水。基于此,本文详细介绍聚合氯化铝处理工艺,其净化水质
分析了梨树县耕地质量现状,包括土壤耕层厚度、速效养分、酸碱度、有机质、容重、全量及中微量元素等情况,并提出了监管与应对措施,以期为提高当地耕地质量提供参考。