【摘 要】
:
分层文本分类在现实中应用比较广泛,在数据不理想的情况下,充分利用分层结构信息对提高分类效果有很大的帮助。针对警情数据,为了充分利用其现有的分层结构信息,缓解数据严重不均衡的问题,提出了一种基于BERT的迁移分层文本分类模型,利用BERT预训练模型充分提取警情领域相关信息,用于分层文本分类。实验结果表明,利用结构信息和迁移学习对结果都有不同程度的提高,尤其是对数据少的类别。
【机 构】
:
上海市公安局科技处,上海德拓信息技术股份有限公司
【基金项目】
:
上海市科学技术委员会科研计划项目“:城市大脑”一期“/平安大脑”关键技术及应用研究(18DZ1200900)。
论文部分内容阅读
分层文本分类在现实中应用比较广泛,在数据不理想的情况下,充分利用分层结构信息对提高分类效果有很大的帮助。针对警情数据,为了充分利用其现有的分层结构信息,缓解数据严重不均衡的问题,提出了一种基于BERT的迁移分层文本分类模型,利用BERT预训练模型充分提取警情领域相关信息,用于分层文本分类。实验结果表明,利用结构信息和迁移学习对结果都有不同程度的提高,尤其是对数据少的类别。
其他文献
摘 要:为提高碳纳米管(CNT)膜卷纱传感性能,通过喷涂的方式制备聚(3,4-二氧乙撑噻吩):聚苯乙烯磺酸(PEDOT:PSS)/CNT复合薄膜,采用自主搭建的加捻装置加捻制备宽度与捻度不同的12种PC(PEDOT:PSS/CNT)膜卷纱。通过直径与外观以及拉伸-电阻变化测试,研究分析PC膜卷纱的力学性能、传感性能及传感循环稳定性能,与CNT膜卷纱的性能进行对比分析。结果表明:在最优的测试参数下,
为探讨丝胶蛋白整理到腈纶织物对其透气透湿性能的影响,将太古油与丝胶在超声波作用下充分混合制成丝胶改性液,然后将经碱减量处理后的腈纶织物采用两步法浸渍氮丙啶交联剂溶液和丝胶改性液,以此获得丝胶改性后的腈纶织物.研究了丝胶整理前后织物的回潮率、耐水洗性、断裂强力、透气透湿性、红外光谱、表面形貌等性能.结果表明:丝胶通过氮丙啶交联剂的作用已整理到腈纶织物表面;丝胶整理后腈纶织物回潮率由原来的1.76%提升至2.92%~8.34%;经水洗后其回潮率稳定在2.03%左右;改性后腈纶织物的经向断裂强力较原样降低17.
摘 要:新型吸波剂对于雷达隐身和人体防护具有重要意义,石墨烯作为新型碳材料,因其密度小、导电性好、比表面积大等优良特性被认为在吸波领域具有良好的发展前景。但石墨烯的阻抗匹配较差且容易发生团聚,所以不宜单独作为吸波剂使用。为更加充分地发挥石墨烯的性能优势,将其与其他导电聚合物或磁性材料等复合,是增强吸波能力的一种有效途径。此外,将二维结构的石墨烯改造成三维多孔结构,不仅能达到良好的吸波效果,还能使材
摘 要:单品级纺织服装产品的全生命周期自动化管理对超高频射频识别(UHF RFID)标签的经济、舒适和耐用性提出了更高要求。现有的硬质标签因为综合成本高、非柔性、不易集成于织物,无法满足纺织品租赁、洗涤、售后跟踪的使用要求。丝网印刷织物基UHF RFID标签是实现纺织品精确管理的重要途径,但是其耐洗涤性差和影响产品舒适性仍然是规模应用前的瓶颈所在。概述了UHF RFID标签的工作原理和丝网印刷工艺
摘 要:加压服装疗法是临床上治疗烧伤增生性瘢痕的重要手段,正确且积极的恒压治疗有助于提高压力服治疗增生性瘢痕的治疗效果。综述了压力疗法研究现状、增生性瘢痕的压力服的制作与临床现状,并从当前压力服装临床使用中存在的问题入手,针对当前压力服在临床使用中不能维持特定且均匀的治疗压力,以及长期使用依从性低与护理不当等问题,对治疗增生性瘢痕压力服的研发提出了展望。未来可从压力衰变调节系统开发、运用嵌入式柔性
面向训练语料有限的语音识别任务,立足语音识别基本流程,基于隐马尔科夫模型-高斯混合模型(GMM-HMM)对俄语孤立数字语音进行识别.结合俄语语音特点,分析词语语音结构,归纳了
为解决现有的虚拟实验存在交互形式单一、设备昂贵、沉浸感不足等问题,提出多通道交互的虚拟实验平台。该平台借助增强现实技术实现并支持手势交互、温感与嗅觉多感知通道呈现。围绕平台的结构设计、手势交互的实现以及多感知通道呈现方面三个方面进行阐述。最后,通过两个虚拟实验对平台的易用性与实用性进行验证。结果表明平台交互自然,真实感强,能帮助学生掌握实验知识。
摘 要:为实现微波对羊毛鳞片尖端的精准作用,根据微波辐射的选择性加热规律,选择介电损耗因数远高于羊毛纤维的纳米钛酸钡颗粒,利用超声波震荡将其负载在羊毛鳞片尖端翘角内,以吸收大部分微波辐射能。结果表明:40 kHz超声波在40 ℃预处理40 min时对羊毛纤维的损伤最小,由于超声波震荡作用,羊毛纤维表面缝隙内负载纳米钛酸钡颗粒,再经微波处理后的羊毛纤维鳞片尖端钝化,定向静摩擦效应降低了38.8%,定
TOR是世界上最受欢迎的匿名通信系统,也因此逐渐成为攻击和审查的目标。大量工作研究了TOR对于各类攻击的脆弱性,而攻击者一旦控制了通信链路入口节点,链路两端被观察的概率将大大提高,进而破坏通信双方的匿名性,对用户安全构成严重威胁。通过分析TOR路由选择算法,对受控恶意入口节点进行有效的分配部署来提高受控入口节点被选率。实验表明,当攻击总资源一定时,受控节点带宽设置在53.8 Mbit/s左右更易被用户选择。
摘 要:为拓展聚丙烯纤维材料的应用领域,针对等离子体处理对聚丙烯纤维材料润湿改性的影响进行了研究。将聚丙烯(PP)纤维膜经等离子体处理后,再利用多巴胺(PDA)对其进行了化学接枝改性,并对所制备材料的形貌、化学性能、接枝程度和相对润湿性进行了系统性的表征。结果表明:经等离子体处理后,多巴胺处理对聚丙烯纤维膜的表面润湿性能明显提升,接触角可从80°降低至0°。在等离子体处理过程中,当氧气与氩气的比值