论文部分内容阅读
近些年随着人机接口和智能人机交互技术的发展,智能机器人技术逐渐成熟,尤其是服务型机器人逐渐走向家庭。与此同时,由于机器人的运动路径的不确定性、噪音以及混响的干扰,并且针对语音定位及麦克风阵列模型的简便易携带等需求的日益提高,使得移动机器人的语音定位技术面临极大的挑战。
针对这种情况,本文在实验室自主研发的智能交互机器人“鹏鹏Ⅱ”的平台上从四麦克风构成的十字形平面麦克风阵列出发,对动态环境下的机器人语音定位进行了研究。首先搭建实验平台,确定麦克风阵列模型的参数及属性;然后结合空间环境的特性提出谱减法和倒谱均值归一化相结合的去噪算法;接着提出基于广义互相关.改进相位转换加权函数的算法(GCC-PHAT-ργ)和指导性谱分割技术计算麦克风对的到达时间差的算法;最后采用几何定位法计算声源的位置。本文的主要工作在于:
(1)针对移动机器人运动时产生机体噪音的特点,提出谱减法和倒谱均值归一化相结合的去噪算法;
(2)提出广义互相关函数相位转换改进加权函数算法;
(3)为消除语音源通过墙壁和机器人身体等障碍物产生的混响,提出指导性谱分割技术,结合(2)获得的定位结果和信噪比将频率片分割进行分别加权,获得锐化的互相关函数峰值,即时间差。
(4)将机器人语音定位与语音识别、全方位视觉跟踪和举手检测结合,形成一个多功能的移动机器人系统,并用“捉迷藏”的游戏验证了系统的可靠性、鲁棒性和高效性。
本系统共完成2936组实验,即使在噪音和混响比较严重的环境中,仍然有超过2800组实验取得良好的定位结果。利用指导性谱分割技术有95%以上的实验数据最终定位角度误差控制在15°以内。同时算法的实时性好,基于四个麦克风阵列的实验数据平均每次语音定位时间小于0.4s。