【摘 要】
:
近年来,机器人各个方面的能力都在快速追赶人类,甚至在某些领域已经超过人类。在这一过程中,科学家和工程师们最喜欢在机器人身上打造出类似人类的感官模式,以更好地感知世界。不过现阶段的很多技术都只专注于再现人类的视觉和触觉,比如炙手可热的计算机视觉技术。相比之下,复制人类其他感官的研究却没有太多进展。 卡内基梅隆大学(CMU)的研究小组近日发表一项新成果——探索如何利用声音开发感知功能更先进的机器人。
论文部分内容阅读
近年来,机器人各个方面的能力都在快速追赶人类,甚至在某些领域已经超过人类。在这一过程中,科学家和工程师们最喜欢在机器人身上打造出类似人类的感官模式,以更好地感知世界。不过现阶段的很多技术都只专注于再现人类的视觉和触觉,比如炙手可热的计算机视觉技术。相比之下,复制人类其他感官的研究却没有太多进展。
卡内基梅隆大学(CMU)的研究小组近日发表一项新成果——探索如何利用声音开发感知功能更先进的机器人。他们将机器人命名为 Tilt-Bot,字面意思是 “倾斜机器人”,实际上它是一台通过倾斜托盘研究物体运动和声音之间关系的机器,训练后可以实现一定程度的 “听音识物”,准确率接近 80%。研究成果以论文的形式发表在《机器人学:科学与系统》 Robotics: Science and Systems 上。
聽觉与视觉、触觉一样,都是人类收集信息的重要渠道。那么听觉可以为机器人带来什么呢?在回答这个问题之前,我们可以想象一下没有声音的世界。在这种情况下,我们将极度依赖视觉系统收集信息。看视频必须有字幕,与别人沟通必须用文字和手势,永远不知道背后是不是走过来一个人,除非转过头去看。即使眼睛和手可以代劳,很多关键信息也无法准确传达,比如语气、声调以及这些变量背后的潜台词和深意。
机器人也面临着相似的苦恼:感知物理世界的渠道太过单一,依赖性过强,因此无法有效利用普遍存在的信息。如果能有效收集声音数据,再配合上视觉信息,它们对环境的感知力将大幅提升。CMU 团队以此为核心思想,设计出了 Tilt-Bot 机器人。它本质上是一台托盘机器人,由拥有多个关节的机械臂、托盘和固定装置组成,托盘四周有边框,上面贴着用于记录物体撞击的声波捕捉装置。托盘的正上方还固定了一个摄像头,用于捕捉物体运动轨迹,后期再与声音变化相匹配。
实验时,研究人员会把不同的物体放到托盘中,机械臂随后开始向前后左右倾斜,托盘中的物体也随之移动。如果倾斜过大,物体就会撞到边框并发出响声,撞击力度越大,捕捉到的声波波峰也就越高。团队总共收集了 60 个不同物体的 1.5 万次交互记录,每组记录都包含匹配的视频和音频数据。他们用这些数据创建了全新的图像 音频数据集,用于训练机器人在动作、图像和声音之间建立有意义的联系。
一个有趣的发现是,受过训练的机器人只需要分析物体滑动和撞击的声音记录,就可以区分不同物体。即使同是金属质地的螺丝刀和扳手也可以成功分辨,总体成功率接近 80%。这意味着训练机器人学习物体的音频表示形式是有意义的。另一个更有价值的发现是,音频有时比视觉提供的有价值信息更多,或者说适用面更广。由于声音是以声波的形式传播的,其传播轨迹更直观,可以更有效地预测物体未来的运动轨迹,从而帮助机器人更好地控制物体。用从未见过的物体测试机器人性能时,如果同时使用视频和音频数据,那么它预测如何更好操控物体的表现相较于只使用视频时提升了 24%。
包含音频和视频的数据集可以帮助更多人开发机器人,尤其当它们被派去执行的任务需要两者兼顾时。研究团队表示现在的成果只是第一步,未来将探索声音数据分析还能挖掘出机器人的哪些潜力,进一步提高它们的感知能力,并且将其运用到更实际的任务中。“这些初步研究成果是令人兴奋的,证明了机器仅凭声音就能识别出物体类型,” 研究人员莱雷尔·平托表示,“这样一来,机器人执行任务的时候就可以更有针对性,比如学会区别对待空酒杯和满酒杯。”
(摘自美《深科技》)(编辑/多洛米)
其他文献
前两天加拿大发生了一件很奇葩的新闻:住在魁北克省的一位父亲,为了让八岁的女儿吃一种叫做“抱子甘蓝”的蔬菜,放了个大招——不吃完蔬菜,就不许离开餐桌。 特意搜了一下抱子甘蓝的图……看起来就很不好吃的样子?再联想一下北美本地人民的烹调水平,真是令人瑟瑟发抖。 你猜这个不爱吃蔬菜的孩子和她老爸对峙了多久?说出来简直是让人发指,足足13个小时,整整一夜,期间孩子尿湿了衣裤,也不允许离开餐桌,孩子冷
如何找到老式的弗兰克·劳埃德·怀特窗户或着一个废弃很久的剧院,艾瑞克·诺德斯通和他的拯救专家团队搭档能够解决这些问题。
近日,《Nature Medicine 》发表了美国哈佛大学遗传学教授乔治·丘奇领导的来自韦斯研究所、哈佛医学院和乔斯林糖尿病中心合作团队的一项最新重磅成果。研究人员在马拉松运动员的肠道微生物群落中发现了一种能提高运动成绩的微生物,并且小鼠实验证明,移植马拉松运动员身上分离出来这种肠道细菌,能够将小鼠的运动测试表现提高 13%。 这一发现也为开发有效提高运动成绩的益生菌铺平了道路。“在这个项目开
5月19日,一位黑人牧师的敦促和一个福音唱诗班的歌声在英国一座千年古堡里回荡,哈里王子与美国女演员梅根·马克尔完婚,将英国王室带入一个新时代。 王室新时代的婚礼 一直认为自己是女权主义者的马克尔,独自走进圣乔治礼拜堂,而不是由父亲送进来,这个偏离悠久传统的做法本身就向世界传递了一个信息。她丈夫的父亲、英国很可能的未来国王查尔斯王子在教堂通道的中点迎接了她。 哈里王子是王位的第六顺位继承人
11月初,美国总统特朗普开始了亚洲之行,访问日本、韩国、中国、越南和菲律宾。在当选一周年之际开启亚洲访问行程,特朗普的亚洲政策备受关注。因为和前任奥巴马一心推进“重返亚洲”相比,特朗普的重心是“美国优先”,其亚洲政策并不明朗。作为亚洲之行的重头戏,特朗普的访华也让媒体有更多的期许。特朗普此次访华,积极推进务实合作,取得了互利共赢成效。特朗普访华成果丰硕 访问北京,特朗普饶有兴致地游览了北京故宫博
飘飘随着Windows 7的发布,2009年年末面市的不少一体机都开始应用多点触控技术。不过用户通过购买一体机体验多点触控操作,所费成本较高,因此对用户来说,桌面多点触控更容易实现,也是更实惠的应用途径应该是显示器。但现实却是显示器厂商光打雷不下雨,市场端迟迟不见动静,这是怎么回事?多点触控技术早已不是什么新鲜玩意儿,当这一操作方式因iPhone的流行而被广泛关注后,我们已经可以在越来越多的手持设
13年前,足病医生阿里·萨德里耶在美国加州比佛利山开设埃沃高级足外科诊所时,有些女人因为穿时髦的鞋子脚疼要求做手术,他当时认为她们有点爱慕虚荣。 “病人们把自己梦想穿上的鞋子带到诊所来,表面上看,这样做很肤浅。但是我后来明白她们需要这些鞋子增加自信,鞋子是她们外表的一部分。这就是现实。” 对萨德里耶来说,足部外科手术是医学和童话故事的结合。在他的诊所,你不是进行囊炎切除术,而是进行“灰姑娘手术
沙特,这个盛产石油的国家,自打决定解除女性驾驶禁令后,在全世界开始了招募女教官的行動。 来自英国威尔士地区的苏珊·纽邦在1500个应征者中脱颖而出,成为三位被选中去沙特训练驾校女教官和女考官的女司机。另外两位沙特选中的外国女司机是加拿大的狄波拉·谢伍德和美国的诺玛·阿德安森。 沙特是全世界唯一一个禁止女性驾驶的国家。但这一情况从6月24日开始将彻底改变,沙特国王于2017年9月颁布命令,从20
今年夏天到英国南部海岸的人可能会看到一个难得的景象,近海停泊着多艘大型邮轮,这些邮轮明显没有载客,哪里也不去就待在那里。 夏天通常是邮轮旅行的旺季,在地中海和加勒比海航行的许多邮轮今年因为新冠病毒疫情而空荡荡的停泊在英国南部外海,吸引许多人注意。从朴次茅斯到普利茅斯,在海边就能看到许多大型邮轮,入夜后船上灯火通明,在海平面上非常绚丽。 大型邮轮难得聚集在海上,也意外成为海岸线上一个景点,有人愿
韩国人乔迁之际通常会吃炸酱面与糖醋肉,《优雅的谎言》里刚痛失幼女千智的妈妈,搬家后做的第一件事就是坐到门口饮食店,点了两碗炸酱面一份糖醋肉。大女儿万智说怎么吃得了,妈妈回答:“我们两个人要过得像三个人一样。”很大的碗深不见底,泥淖一般的面条,吃得嘴角一片污浊。此后妈妈不间断地来吃炸酱面,很爽朗地与店主打招呼。老板娘终于忍不住求饶,因为她女儿花莲在校园欺负过千智,但被妈妈打断,“可以说出口的道歉,是