论文部分内容阅读
随着互联网的飞速发展,结构化和非结构化的文本数据增长速度迅猛,如何从海量的文本数据中抽取有用信息已经成为当前的研究重点。命名实体识别是信息抽取的子任务之一,是从无规则的非结构化文本中抽取有用信息的底层技术,命名实体识别的效果直接影响很多自然语言处理领域的任务。现代社会汽车已经普及,从汽车文本数据中抽取命名实体信息也变得越来越重要。因此,面向汽车领域的命名实体识别研究具有重要的意义。近二十年来,以深度学习为首的人工智能再度成为时代的潮流。在自然语言处理领域,循环神经网络(Recurrent Neural Network,RNN)逐渐成为主流方法,尤其是门控循环单元(Gated Recurrent Unit,GRU)的提出,能够更好地捕捉时间序列中时间步距离较大的依赖关系,在自然语言处理领域得到了广泛应用。随着Attention机制在自然语言处理领域的成功运用,学术界已经将Attention机制与深度学习巧妙地融合在一起,从而让深度学习拥有了更加强大的特征抽取能力。本文首先重点介绍了命名实体识别的研究背景和重要意义,介绍了国外和国内命名实体识别的研究现状,并对中文命名实体识别过程中应用到的技术和方法进行了简要的描述。在接下来的三个章节中,本文针对汽车领域命名实体识别问题依次提出三个模型,并对每个模型进行了详细的介绍和分析,构建了汽车领域命名实体标注数据集,并在该数据集上进行了详细的实验来对比不同参数以及不同模型的具体结果。本文提出了基于BLatticeGRU的命名实体识别模型,并对模型进行了详细的介绍,概述了模型的训练过程。提出汽车领域命名实体标注规范并在此基础上构建了汽车领域命名实体标注数据集Automobile-NER。在Automobile-NER数据集上对BLatticeGRU模型和基线模型进行了对比,实验表明该模型的性能优于基线模型。在此基础上,本文将BLatticeGRU和Transformer进行了融合,构建了BLatticeGRU-Attention模型。然后通过实验验证了biword和Transformer层数对模型性能的影响,又通过与BLatticeGRU模型进行对比,验证了BLatticeGRU-Attention模型的有效性。最后,本文将BLatticeGRU、Transformer和条件随机场(Conditional Random Fields,CRF)融合在一起,提出了基于BLatticeGRU-Attention-CRF的命名实体识别模型,并在Automobile-NER数据集上对该模型与其他模型进行了对比,验证了该模型在汽车领域命名实体识别任务中的良好效果,得到了精确率94.05%,召回率93.92%,F1值93.98%的实验结果。