论文部分内容阅读
近年来,随着人工智能逐步渗透到各行各业,在中小学教育领域,桌面教育机器人是主要的应用方式之一。其中,视觉交互是桌面教育机器人的核心交互方式,但在实际的应用过程中存在拍摄图像分辨率低和拍摄图像存在倾角等问题,本文针对视觉交互中存在的图像分辨率低和图像存在倾角两个难点进行深入的研究,具体研究工作概括如下:首先,针对拍摄时目标的移动或动态光照变化等原因导致拍摄的图像分辨率低的问题,提出了一种基于卷积神经网络的图像超分辨率重建算法。该算法具有两个通道的卷积神经网络,相对于一般的单通道网络,增加的第二条通道为引导通道,其是利用输入图像的掩码图像来引导网络学习到更多的特征。利用此方法,该算法可以充分利用图像特征,使网络可以快速收敛并且提高图像重建效果。其次,针对目标的旋转或拍摄角度的不确定性导致拍摄的图像存在倾斜角度的问题,提出了一种基于级联卷积神经网络的课本图像倾斜校正算法。该算法分为两个步骤:第一个步骤是利用级联CNN对课本做关键点检测,第二个步骤是根据关键点对课本图像进行倾斜校正。利用这些方法,算法可以更好的应对环境光照变化、目标遮挡、旋转等问题。在上述提出的两个算法的实验中,都将本论文算法跟多个当前主流的算法进行对比,并进行多网络结构参数和多数据库的实验对比,结果都表明本文所提出的算法在多种情况下都有更好的性能表现。