论文部分内容阅读
在计算机视觉领域中,传统的机器学习方法总是假设模型的训练集和测试集具有相同的数据分布,而现实中,由于成像设备和环境条件等方面的差异,容易导致训练集和测试集具有明显的数据分布差异。此种情况下,直接应用训练集中学习的模型到测试集,模型的性能将会出现大幅度降低。记训练集为源域,测试集为目标域,跨领域图像识别方法就是为了解决源域和目标域之间存在数据分布差异的问题,实现源域中学习的识别模型以较小的性能损失应用到目标域的目的。本论文从跨设备场景图像识别中存在的设备间数据分布差异问题出发,围绕跨领域图像识别问题,开展了以下几个方面的研究工作: 1、提出了一种半监督的跨设备场景图像识别方法,用于实现以监控图像为参考的手机查询图像的场景定位。该方法首先构建了一个跨设备场景图像数据集,基于不同的时间和天气条件,利用监控摄像机和手机相机同时收集每一个位置的场景图像。其次,针对此跨设备场景图像识别中存在的设备间数据分布差异和有效训练样本少的问题,通过联合基于子空间投影的领域自适应方法和Laplacian SVM提出了一种对应的跨设备场景图像识别方法,有效地提升了识别的性能。此外,该方法还对于时间和天气因素在跨设备场景图像识别中的影响进行了初步探索。 2、提出了一种基于低秩重构的跨领域图像识别方法,通过学习鲁棒的低秩特征表达减小领域间的数据分布差异。该方法首先利用子空间对齐技术将源域和目标域样本对齐到一个共同的子空间中。然后,在子空间中学习一个领域间共享的字典。最后,基于学习的字典,低秩重构子空间中的所有样本,对应的重构表达能有效地获取样本之间潜在的结构信息并同时削弱噪声信息的干扰,具有较强的领域自适应能力和噪声鲁棒性。 3、提出了一种基于目标对齐的跨领域图像识别方法,通过目标对齐技术削弱背景因素在造成领域间数据分布差异的影响以简化跨领域图像识别问题。该方法首先利用一种弱监督的目标检测技术对齐具有类似视觉外观的语义目标,进而学习对噪声背景信息的干扰鲁棒的目标检测子。然后,利用图像分类的信息增强目标检测子的性能。最后,基于目标检测子,引入一种自学习的自适应方法进一步强化模型的领域自适应能力。 4、提出了一种基于卷积神经网络的跨领域图像识别方法,通过卷积神经网络模型直接学习具有领域不变性和类间判别性的特征表达来解决跨领域图像识别问题。该方法利用深度卷积神经网络的强大学习能力,将领域不变性特征的学习和识别模型的训练联合到同一个卷积神经网络模型中,通过同时优化样本标签预测、领域标签预测和样本相似性预测三个目标函数的损失,确保网络所学习的特征表达具有较强的类别判别性和领域不变性。