基于BERT+BiLSTM+CRF模型和改进Apriori算法的交通事故文本分析

来源 :长安大学 | 被引量 : 0次 | 上传用户:skyy2483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通事故分析对于交通安全有着重要意义。现行分析多以交管部门提供的结构化编码数据为基础,而对交通事故文本类数据利用不够。这主要是由于文本中存在的大量时间、地点、数字、伤亡结果等关键异构数据难以被有效提取。现有的交通事故文本信息提取手段多采用基于静态向量的深度学习模型,这种方法虽然可以自动提取文本异构数据的特征,避免了人工设计规则带来的耗时问题,但提取信息的精确度较低。鉴于预训练语言模型BERT在其它文本挖掘领域的良好表现,论文主要研究BERT与深度学习网络的融合模型应用于交通事故文本关键异构信息提取。在深度学习模型高效率的基础上提高信息提取的精确率,并结合设计改进的关联规则挖掘算法对事故进行分析。论文主要工作包括:(1)构建了一种基于动态字向量的融合模型BERT+BiLSTM+CRF用于交通事故文本异构关键信息提取。利用BERT对文本字符进行动态向量映射,从数据表达源头解决一词多义、上下文依赖不充分等问题;利用BiLSTM提取文本向量化后的特征,输出高特征的文本序列;利用CRF能够计算全局最优输出节点的概率优势,优化文本序列特征结果。通过对比实验,该模型在交通事故文本中提取信息平均准确率为0.924,F1为0.918,比基于静态词向量Word2Vec的模型精确率与F1值分别提高了3.8%,8.1%。(2)针对传统Apriori算法在挖掘交通事故数据中存在候选集数目巨大、生成规则维度单一等问题,设计了一种具有多属性约束条件的改进Apriori算法。利用交通事故数据中多值属性的特点,对数据进行统一取值整理,并通过调整规则维度的阈值,设计多属性约束条件剔除Apriori算法生成的无效规则。实验表明,改进算法的运行时间平均减少38.3%,且避免了无效规则的生成。(3)设计并开发了交通事故文本分析系统,该系统具有交通事故文本数据采集、事故文本信息抽取、关联规则分析、自定义分析结果展示、自定义导出等功能。系统可用于有关部门分析交通事故文本数据,并制定相应决策。综上,构建的基于BERT+BiLSTM+CRF模型能够有效的提取交通事故文本中的关键数据;改进的Apriori算法挖掘交通事故规则效率更高,能得到更多科学的结果;设计的交通事故文本分析系统能够基本满足交通事故文本数据的分析要求。
其他文献
为了保证液化天然气(LNG)接收站安全平稳的运行,及时掌握站内关键设备的腐蚀情况,通过数值模拟及管路式冲刷腐蚀装置,研究了LNG接收站中间介质气化器(IFV)海水系统在不同流速和不同石英砂含量下的冲刷腐蚀行为,通过SEM、EDS和失重法对典型管件的微观形貌和腐蚀速率进行了分析.结果 表明:LNG接收站IFV海水系统在正常工况下不存在明显冲刷腐蚀现象;当流速达到12 m/s时,各管件微观上均存在明显冲刷痕迹,入口第一弯头和盲三通处最为明显,相比于沙粒浓度,流速对冲刷速率的贡献更为显著,管路式试验结果和数值模
为探讨室内中性盐雾+周浸加速试验对热镀锌钢的加速性以及室外曝露试验与室内加速试验的相关性,通过腐蚀动力学、腐蚀产物宏观形貌、微观组织以及物相组成等方面的表征,研究了输电杆塔用热镀锌钢在室内中性盐雾+周浸加速试验与东南沿海地区高温高湿的大气环境室外曝露试验中的腐蚀行为.结果 表明:相对于室外大气曝露试验,经过5个周期的中性盐雾+周浸试验,热镀锌钢平均腐蚀速率明显增大,腐蚀加速比为416.1,中性盐雾+周浸可以快速模拟热镀锌钢从服役到失效的过程;SEM和XRD结果表明室内加速试验后期形成Zn5(OH) 8Cl
部分海上稠油高温热采中产生了少量H2S,游离的H2S会给海上平台生产带来一定的安全隐患,而在生产热采井井下注入脱硫剂可以清除游离H2S,并减轻油管腐蚀,但目前就生产油井中脱除H2S的研究鲜见报道.为此,通过自制装置,在80℃模拟热采井产出水中评价了脱硫剂的脱硫效果,以及180℃高温老化处理后脱硫剂的效果;进一步通过失重试验,评价了筛选出的脱硫剂对N80钢腐蚀和缓蚀剂的影响.结果 表明脱硫剂DES-8的综合性能最好.80℃时含1000 mg/L H2S的模拟地层水中,1000 mg/L脱硫剂DES-8的脱硫
在热浸镀锌中,锌浴的流动性和表面张力对镀层的表观质量,组织结构及性能有重要影响.为了探讨不同成分的铁、铝含量对锌浴的流动性和表面张力的影响,配制了不同铝、铁含量的合金锌浴,其中铝(0.20%,0.25%,0.30%,0.35%,0.40%,0.45%,质量分数,下同)、铁(0.003%,0.006%,0.009%,0.012%),对其在系列温度450,453,456,459,462,465℃下锌浴的流动性和表面张力进行了测试和分析.结果 表明:当铁、铝成分一定时,随着温度的升高,锌浴的表面张力降低,流动性
土工格栅加筋边坡被广泛运用于软基处理、旧路改扩建路堤拼宽、路基填挖结合部、路堤边坡加固中,其加筋法的原理是在土中设置抗拉强度高的筋材,通过筋材与土体之间的相互作用来约束土体的应力应变,从而使土体整体的力学性能得到提升,整体的强度得到增强。本文将通过进一步对加筋路堤作用规律进行研究,分析加筋路堤变形及稳定性影响因素,从而为加筋路堤合理设置提供一定理论支持。本文依托山西省祁县至离石高速公路项目,并结合
为了实现混凝土桥梁附属钢结构的长效防腐蚀,研制了一种水性单组分丙烯酸烤漆,在钢铁基材表面采用了多元素粉末共渗+钝化+封闭漆处理防腐蚀技术(PCA),并对该技术的体系选择、制备过程、光泽、附着力、耐候性、防腐蚀性、耐湿热、耐二甲苯浸泡性能、施工工艺等方面进行了阐述.结果 表明:研制的水性单组分丙烯酸烤漆具有优异的物理力学性能、耐候性、防腐蚀性、耐湿热性能及耐二甲苯浸泡性能等.采取浸涂工艺,一方面使涂膜更加完整,另一方面提高了涂料的利用率.
为了提高醇酸树脂磁漆的防腐蚀性能,以干性长油度醇酸树脂为主要成膜物质、丙烯海松酸(乙三胺)为缓蚀剂并添加其他助剂,制备了松香基醇酸树脂磁漆,并用喷涂法将其均匀地喷在预处理后的马口铁板上.用Tafel极化曲线、电化学交流阻抗测试、附着力测试、硬度测试和盐雾试验测试了涂层的性能.结果 表明:与空白醇酸树脂涂层相比,添加了缓蚀剂丙烯海松酸(乙三胺)的醇酸树脂涂层的性能有很大的改善,且加入丙烯海松酸(乙三胺)质量分数为0.3%的醇酸树脂涂料的各项性能最佳,硬度为2H,附着力为1级,腐蚀电流密度为1.8×10-6
切削作为喷丸的前置工艺,会对喷丸后的应力和变形产生影响.为了对这种影响进行定量分析,研究了切削状态下7075铝合金试片喷丸后的残余应力和变形情况,并设置了切削试片退火后再进行喷丸的退火状态对照组.结果 表明:相同喷丸参数在切削状态下得到的残余应力要明显大于退火状态,而变形量的差别较小.有限元仿真结果证实了试验结果,并进一步模拟了不同退火程度后进行喷丸的仿真结果,结果表明退火越完全,喷丸后的残余应力越小.切削工艺使喷丸后最终残余应力值增加,但对喷丸过程的变形增量影响较小.
为了准确评价耐磨磷化层的性能,利用扫描电镜研究了磷化层结晶尺寸与平均厚度的对应关系、结晶尺寸与基体腐蚀凹陷深度和数量的对应关系以及磷化层结晶尺寸、覆盖率、基体腐蚀凹陷程度对磷化层润滑性能的影响.结合失效分析案例得出磷化结晶尺寸为4~10 μm,在一个20 mm测量长度上,15~30 μm深度范围的腐蚀凹陷的数量不超过30个,不少于15个,大于30μm深度范围的腐蚀凹陷的数量不超过5个,覆盖率为100%时,磷化层的润滑性能最好.形成采用扫描电镜观察磷化层的结晶尺寸、覆盖率以及基体腐蚀凹陷程度来评价磷化层性能
为了促进短切玄武岩纤维(BF)在涂料填料中的应用,制备了不同含量、不同尺寸的短切玄武岩纤维增强复合涂层,研究了复合涂层的力学性能、耐腐蚀及耐磨性能.其中短切玄武岩纤维含量分别为0%(质量分数,下同)、5%、10%、15%、20%、30%;短切玄武岩纤维长度分别为0~10 μm、20~40 μm、40 ~ 60 μm、60~ 80 μm、80~100μm(分别对应的长径比0.1~1.0、2.0~4.0、4.0~6.0、6.0~8.0、8.0~10.0).结果 表明:不同含量中,添加30%短切玄武岩纤维复合涂