【摘 要】
:
近年来,无论是国内外中小学STEM教育热点向人工智能方向的转移,还是在线教育平台对人工智能相关内容的引进,都表明人工智能教育正呈现低龄化趋势。现阶段,国内外针对青少年开发的机器学习平台还处在初级阶段,普遍存在训练效率低、数据规模小的问题。在各类训练数据中,图像数据质量和算法选择对于模型性能的影响最为明显。而图像分类模型作为机器学习平台的重要组成部分,其数据要求高、训练成本高、训练周期长等特点,不能
论文部分内容阅读
近年来,无论是国内外中小学STEM教育热点向人工智能方向的转移,还是在线教育平台对人工智能相关内容的引进,都表明人工智能教育正呈现低龄化趋势。现阶段,国内外针对青少年开发的机器学习平台还处在初级阶段,普遍存在训练效率低、数据规模小的问题。在各类训练数据中,图像数据质量和算法选择对于模型性能的影响最为明显。而图像分类模型作为机器学习平台的重要组成部分,其数据要求高、训练成本高、训练周期长等特点,不能适应青少年机器学习平台利用少量数据快速训练模型的需求。为此,本文设计了面向小规模数据的图像识别模型在线快速训练系统,并对图像模型自动生成技术进行了深入研究。论文首先对自动机器学习和迁移学习在图像识别领域的国内外研究成果进行分析和总结。然后,本文面向小规模数据的图像识别模型训练,针对数据规模与分布问题,设计了基于数据平衡度的动态数据增强算法,提出基于标签信息和贝叶斯算法的增强策略复用优化技术,实现动态数据增强;针对自动训练功能,提出自适应图像分类模型,首先设计基于迁移学习的自适应算法框架,然后基于任务复杂度设计了模型自动选择算法。最后将动态数据增强过程与模型自动训练过程相结合,设计了模型自动生成解决方案AutoTrain,实现模型参数和增强策略的同步优化。基于以上理论研究成果,本文对面向小规模数据的图像识别模型在线快速训练系统的各个模块进行了设计、实现和测试,并与现阶段主流自动机器学习系统进行了对比。实验结果表明,本文所提出的动态数据增强技术和自适应图像分类模型可以有效提高用户模型训练效率,降低计算资源需求,并解决了数据规模不足与分布不均衡带来的模型性能低下的问题。
其他文献
开发人员为提高软件开发效率,通常会复制已有的代码片段,并粘贴或进行微小修改后重复使用。因此,软件系统中经常会出现相似的代码片段,这种现象被称为代码克隆。虽然代码克隆可以提高初始生产力,但它可能会导致漏洞传播,并增加软件系统的维护成本。近年来,代码克隆检测已经成为软件工程领域一个越来越重要的研究课题。最近的检测代码克隆研究表明,基于抽象语法树的神经网络模型比其他方法能更好地表示源代码。研究人员使用基
近年来,随着三维空间(3D)视觉传感器的广泛运用,三维计算机视觉应运而生。在计算机视觉领域,对三维点云进行语义分割,可用于对三维场景的理解。本文将ORBSLAM3以及已有的点云稠密重建开源项目结合,通过3D传感器采集或合成RGBD图像生成局部点云,并利用SLAM跟踪得到的位姿,完成运动中室内场景点云模型的建立。本文对已有点云重建开源项目进行了以下两点改进:一是增加了用于MYNT等双目深度相机的自建
随着法律从业标准愈加严格,从业人员规模的扩大远慢于刑事案件数量的增加,司法机关面临“案多人少”的困难;且法官的自由裁量权受其学识水平、工作经验等主观因素的影响,可能造成“同案不同判”的情况,影响司法公正性。为解决以上问题,本文以刑事判决文书为输入,使用自然语言处理技术,将案情自动化分析分解为法条推荐、罪名预测、刑期预测与相似案件推荐四个子任务。该方法在司法智能建设中能有助于提高法官的工作效率,平衡
目前,随着航空运输业的不断发展,空中交通量在逐年增加,为了保证飞机在逐渐拥挤的航道内能够安全飞行,需要提高航空监视信息的准确性。航空监视信息的融合通过将来自一个或多个监视源对目标飞行器的监视信息进行融合,来准确的获取目标飞行器的位置,融合效果的好坏很大程度的决定了航空监视信息准确性的高低。在航空监视信息融合方面,目前更多的是采用卡尔曼滤波算法,该算法在大数据量的情况下,存在着参数精度要求高、对噪声
IPv6是下一代互联网的关键技术,其巨大的地址空间能够为计算机相关领域带来无限的发展,从IPv4向IPv6的升级己成为互联网发展的必然趋势。网站服务作为与人们日常生活密切相关的基本服务,对IPv6应用流量拉升和推广部署有重要作用,但缓慢的IPv6网站升级过程却对IPv6的推广带来了不利影响,完善IPv6网站支持度监测对推动IPv6全面部署有重要意义。由于在向IPv6的升级过程中,终端、传输设备以及
近年来,移动通信、物联网等新兴技术的发展极大地推动了互联网的进步,提高了人们的生活质量。在这其中,DNS域名服务器作为分布式服务系统承载着网络服务的访问入口,正发挥着越来越重要的作用。然而另一方面,互联网作为一个开放的平台来方便人们对信息的分享,但是关键基础设施DNS域名服务系统却是一个中心化的架构,其根服务器数量稀少而且分布不均匀,存在着集中解析霸权且不信任的问题。一旦根域名服务器中的域名信息被
在移动互联网时代,移动应用(APP)构成了现代人们日常生活中的基本要素。随着Android移动应用生态的蓬勃发展,恶意软件的数量和危害也与日俱增。恶意软检测作为保护移动应用用户的安全和隐私的关键环节,其重要性不言而喻。近年来,许多基于机器学习的恶意软件检测模型被提出并逐渐成为主流检测方法,然而当这些检测模型应用到真实环境中时往往会出现模型失效的现象。本文深入观察和分析模型失效现象,总结出数据非同分
汪曾祺的作品在20世纪80年代进入大众的视野,他的代表文章《受戒》等都呈现出一种清淡悠远的风格。但是较少有研究者注意到汪曾祺晚期作品风格及题材的变化,本文在阅读了相关文献之后,对汪曾祺晚期作品的风格及题材做简单说明,探究其晚期作品风格转变的原因。