论文部分内容阅读
目前,人机交互技术已经从传统的单通道交互方式向智能自然的交互方式转变,而智能化的交互技术需要计算机能够主动感知用户的意图并进行互动,形成一种主动的多通道互动模式。计算机可以通过多种信号感知识别用户身份和行为,例如听觉信号、视觉信号、生理信号、触觉刺激、环境因素等,而视觉信号具有一定的优势,从视觉获取的信息不仅数量多,而且真实可靠,能够直接客观的反映用户的心理活动和行为。网页是重要的人机交互界面,从视觉角度针对以网页的研究主要集中在同一用户对网页上不同类型信息的研究,而以网页为界面对同一类型信息不同用户识别的相关研究很少。因此我们使用模式识别方法,使计算机根据不同的视觉模式主动识别不同用户。 本文对基于视觉行为的网上用户识别方法进行了研究,并且应用在浏览任务下老年人和青年人的识别。 首先,针对眼动数据的时间性、空间性特点,提出了基于隐马尔科夫模型的用户识别方法,隐马尔科夫模型(Hidden Markov Model,简称作HMM)是一种精确匹配时变数据的技术,其优点在于可根据概率模型描述观察值序列,用较少的训练样本就能建立一个比较完善的数据库,而且建模简单。使用老年人和青年人的网页视觉浏览眼动数据,选择瞳孔直径、眼跳距离、注视时间、注视次数及其组合特征做为分类特征,对各项眼动数据进行归一化处理和标量量化,比较隐马尔科夫模型与支持向量机的分类效果,结果表明瞳孔直径和组合特征的分类效果较好,并且隐马尔科夫模型的分类效果比支持向量机的分类效果好,平均识别率达到96.88%,隐马尔科夫模型能够较好的描述用户的视觉模型。 其次,由于隐马尔科夫模型的训练算法Baum-Welch算法容易受到随机初始参数的影响,易陷入局部最优解,从优化初始参数的角度使用不同智能优化算法对其优化,选择的智能优化算法为遗传算法和粒子群算法,遗传算法具有多初值同时搜索全局寻优的特点,并且染色体间相互共享信息的机制使得整个种群向最优区域移动。粒子群算法的记忆机制、参数较少和收敛速度较快也能较好的优化隐马尔科夫模型。比较其优化效果,遗传算法能够提高训练曲线的收敛精度,粒子群算法能够提高收敛速度,且遗传算法寻优后的HMM模型比粒子群寻优后的HMM分类正确率更高。 最后,由于单个用户针对不同网页进行网上行为时会有多条眼动轨迹,为了有效的保留同一用户对不同网页的视觉信息,丰富用户模型,提出使用隐马尔科夫模型的特征表示方法。使用多条眼动轨迹训练多个隐马尔科夫模型,然后将眼动轨迹中眼动特征投影到有HMM状态转移概率矩阵的特征向量构成的向量空间中,基于这种新的特征表示方法,构造多种分类器的用户分类。通过比较Fisher、支持向量机、贝叶斯、K-近邻结果,贝叶斯分类器的分类精度更高。