论文部分内容阅读
为实现猕猴桃果园环境下移动平台的视觉导航,通过特征选取和视觉检测方法对比确定视觉导航系统的方案;通过卷积层特征可视化技术研究卷积神经网络深度对猕猴桃树干特征提取的影响;通过优化Yolo v3 Tiny模型,使其在计算资源有限的嵌入式设备上实现检测精度和检测速度的均衡性,并验证目标检测模型在不同工况下的适应性,而后利用所检测到的猕猴桃树干目标拟合导航线;通过硬件集成和软件设计搭建视觉导航系统,并通过试验验证导航性能。(1)视觉检测方法与视觉导航系统设计。对棚架式猕猴桃果园进行实地调研,因顶部致密的冠层遮蔽导致棚架下的GPS信号减弱,故选择视觉检测方法实现导航。使用小型无人机在棚架下飞行采集图像数据。分别利用地垄边缘特征与猕猴桃树干特征对数据集进行标注,并训练语义分割Segnet与目标检测Faster R-CNN模型。结果表明:Segnet语义分割精度为80.14%,推理时间为2.5s;Faster R-CNN目标检测精度为79.56%,推理时间为1s。最终因实时性和环境适应性因素选择目标检测方法,并确定视觉导航系统整体方案。(2)基于卷积层特征可视化的猕猴桃树干特征提取。为探究卷积层深度对猕猴桃树干图像特征提取的影响,提出了一种可视化方法分析所提取的特征。首先对所采集建立的数据集进行正负样本分类,将数据集中的树干与输水管交叉区域作为正样本,其余区域作为负样本,输入Le Net、Alexnet、Vgg-16以及定义的3类浅层结构进行训练;然后通过提取激活映射图、归一化、双三次插值的可视化方法,获取各个分类模型最后一个卷积层的可视化结果,通过可视化试验对比可知,Alexnet和Vgg-16能够准确提取测试集图像中的树干区域特征,而Le Net与3类浅层模型在提取树干的同时将输水管、地垄等区域特征一并提取;最后利用上述6类网络结构作为特征提取层的图像分类和目标检测模型对开花期和结果期数据集进行验证,由不同季节数据集特征变化而引起的精度下降幅度作为评判标准:图像分类浅层模型精度下降幅度不小于15.90个百分点,Alexnet与Vgg-16分别下降6.94个百分点和2.08个百分点;目标检测浅层模型精度下降幅度不小于49.77个百分点,Alexnet和Vgg-16分别下降22.53个百分点和20.54个百分点。所有浅层模型因所提取特征的改变,精度产生更大幅度的下降。(3)基于Yolo v3 Tiny-3p的猕猴桃树干检测与导航线拟合方法。对Yolo v3 Tiny模型进行优化,在计算资源有限的Jetson TX2中实现检测精度和速度的均衡性。选用轻量级的卷积神经网络作为特征提取层,并在3个尺度上进行预测。试验结果表明:优化后的Yolo v3 Tiny-3p模型检测精度为87.63%,检测速度为12FPS。黑色地垄工况下检测精度为90.40%,行间生草工况下检测精度为87.23%,地膜覆盖工况下检测精度为85.23%,地膜覆盖工况小目标数量较多导致检测精度最低。提出了基于二次多项式极值点的导航线拟合方法,通过求极值点将所检测到的目标分为左右两类,并分别取边界框下部中点拟合两侧直线,最终求两侧直线的中线得到最终的导航线。试验结果表明:导航线拟合精度为92.15%。黑色地垄工况下导航线拟合精度为92.03%,行间生草工况下导航线拟合精度为93.13%,地膜覆盖工况下导航线拟合精度为91.28%。不同工况下的目标检测结果偏差对导航线拟合的结果影响程度较低,导航线拟合方法的环境适应性较好。(4)视觉导航系统的集成与验证试验。通过硬件集成和软件设计搭建视觉导航系统。导航速度试验设置不同的行驶速度,以横向偏差作为评价标准,得出最终的行驶速度为0.2m/s。初始位置偏斜试验将底盘初始位置偏斜放置,行驶至5m附近可追踪到导航线,航向偏差在0°附近波动,横向偏差范围在5cm以内。不同工况导航偏差试验分别在黑色地垄、行间生草和地膜覆盖3种工况下进行试验,黑色地垄工况下平均横向偏差为7.15cm,行间生草工况下平均横向偏差为6.29cm,地膜覆盖工况下平均横向偏差为7.36cm。视觉导航系统可适应3种不同的工况,但横向偏差波动范围较大。