来源:滚动播报
(来源:千龙网)
机器人在空间感知技术层面又取得新突破。昨天(12日),记者从北京市经信局获悉,北京大学多媒体信息处理国家重点实验室联合香港科技大学、新加坡国立大学以及北京人形机器人创新中心等共同开发一套“视角转换想象系统”,给机器人装上“空间感知大脑”。
该研究团队发布的论文中提到,在传统学习方法中,机器人需通过预先标注的手腕位置信息来训练模型,因此,手腕视角的观测,对于机器人实现视觉抓取和操作的模型至关重要。因为它们能捕捉到精细的手与物体之间的交互,从而直接提高操控性能。
然而,在全球现有数据库当中,超过90%的操作录像采用第三人称视角,直接反映操作细节的第一人称视角数据非常稀缺,这导致机器人难以进行握持、翻转等复杂动作。“现有的世界模型无法弥合这种差距,‘WristWorld’成为首个能够仅基于锚点视图生成手腕视角视频的4D世界模型。”论文中称。
为了解决这一问题,研究团队开发的“WristWorld”技术,让机器人能够通过智能分析外部摄像头画面,自动生成手腕视角操作画面,让其从第三人称视角推测出第一人称视角的精确操作画面,解决机器人精细操作中的数据瓶颈问题。该技术还能让机器人实现“自监督”学习,不需额外的标注信息,便可获得准确的手腕位置估计。
据介绍,“WristWorld”技术为机器人学习领域开辟了新的发展方向,可提升机器人训练效率和效果,增强具身智能进行握持、翻转等复杂动作的能力,将推动机器人在精密制造、医疗手术、食品加工等精细操作领域的应用。