具身智能迎来爆发式增长,未来路在何方?
创始人
2025-06-12 07:01:11
0

人民网北京6月11日电 (记者赵竹青)过去一年,具身智能领域迎来爆发式增长,成为人工智能与机器人技术融合的核心赛道。在近日举行的北京智源大会上,多位专家学者分享前沿研究与产业实践,为推动具身智能从实验室走向广泛场景应用出谋划策。

在具身智能的技术路线与底层逻辑层面,清华大学教授孙富春表示,世界模型是全要素模型,空间智能是其向视觉空间的投影,强调触觉纠偏高于视觉纠偏,需构建包含物理属性等的沉浸式数字物理系统。

清华大学研究员、机器人控制实验室主任赵明国提出,类脑算法可替代传统控制器,人形机器人发展需从运动控制向视觉决策等升级,人类进化的底层运动智能具有启示意义。

在具身智能的数据瓶颈突破路径上,北京大学助理教授、智源具身智能研究中心主任王鹤主张采用合成数据为主、真实数据校准的训练范式,通过十亿级高质量仿真数据训练的端到端模型,可实现零样本泛化,已在零售、工业等场景逐步落地。

上海人工智能实验室青年科学家、具身智能中心负责人庞江淼认为,合成数据有助于本体和场景泛化,但持续压低真实数据采集数量,提升合成数据的质量,直到全合成数据能够达成零样本泛化,需要一定时间。

北京大学副教授卢宗青提出,利用互联网视频预训练姿态生成模型,学习人类运动先验,解决人形机器人数据稀缺问题。

清华大学交叉信息研究院助理教授高阳说,机器人数据采集成本高(需遥操作+物理交互),且难以用语言描述(如游泳),形成“无智能-少机器人-少数据”的恶性循环,可利用互联网视频数据,通过跟踪视频中物体运动预训练模型,再迁移到机器人遥操作数据微调,结合强化学习,解决仿真与现实差距。

在具身智能的通用泛化能力构建方面,智源具身多模态大模型中心负责人、北京大学计算机学院助理教授仉尚航认为,构建具身快慢系统是具身智能从“单一任务/本体”迈向“通用泛化”的关键路径,分别以“大脑(推理)+小脑(控制)”的分层快慢系统和VLA端到端快慢系统两条技术路线,解决跨本体(如机械臂、人形机器人)与场景的泛化性问题。

北京邮电大学教授方斌表示,视触觉感知是具身智能从“感知”迈向“精准操作”的核心环节,需通过传感器创新、仿真数据增强与多模态融合,解决动态环境下的操作稳定性与泛化性难题。

关于具身智能的未来应用,智源研究院理事长黄铁军总结说,预计5-10年,具身智能有望代替人类从事不愿干、危险的劳动,但这并非终极目标,在更远的未来,具身智能有望全面超越人类,代表人类走向星际。

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
舒福德智能床S300 Pro面... 8月13日,以“一键入眠 世界领先”为主题的舒福德智能床新品发布会在浙江嘉兴举行。中国睡谷的首次对外...
小米怎么去除抖音水印保存?分享... 随着抖音的普及,越来越多的人喜欢在抖音上分享和观看短视频。当我们想要保存一些喜欢的视频时,往往会被视...
小米14T Pro海外定档9月... 【ITBEAR】9月23日消息,小米今日在X平台上宣布,旗下新款手机小米14T Pro定于9月26日...
邓宏魁、张涛、李亚栋、孙斌勇获... 出品 | 搜狐科技 作者 | 周锦童 8月16日上午10时,2024未来科学大奖新闻发布会在北京、香...