具身智能迎来爆发式增长,未来路在何方?
创始人
2025-06-12 07:01:11
0

人民网北京6月11日电 (记者赵竹青)过去一年,具身智能领域迎来爆发式增长,成为人工智能与机器人技术融合的核心赛道。在近日举行的北京智源大会上,多位专家学者分享前沿研究与产业实践,为推动具身智能从实验室走向广泛场景应用出谋划策。

在具身智能的技术路线与底层逻辑层面,清华大学教授孙富春表示,世界模型是全要素模型,空间智能是其向视觉空间的投影,强调触觉纠偏高于视觉纠偏,需构建包含物理属性等的沉浸式数字物理系统。

清华大学研究员、机器人控制实验室主任赵明国提出,类脑算法可替代传统控制器,人形机器人发展需从运动控制向视觉决策等升级,人类进化的底层运动智能具有启示意义。

在具身智能的数据瓶颈突破路径上,北京大学助理教授、智源具身智能研究中心主任王鹤主张采用合成数据为主、真实数据校准的训练范式,通过十亿级高质量仿真数据训练的端到端模型,可实现零样本泛化,已在零售、工业等场景逐步落地。

上海人工智能实验室青年科学家、具身智能中心负责人庞江淼认为,合成数据有助于本体和场景泛化,但持续压低真实数据采集数量,提升合成数据的质量,直到全合成数据能够达成零样本泛化,需要一定时间。

北京大学副教授卢宗青提出,利用互联网视频预训练姿态生成模型,学习人类运动先验,解决人形机器人数据稀缺问题。

清华大学交叉信息研究院助理教授高阳说,机器人数据采集成本高(需遥操作+物理交互),且难以用语言描述(如游泳),形成“无智能-少机器人-少数据”的恶性循环,可利用互联网视频数据,通过跟踪视频中物体运动预训练模型,再迁移到机器人遥操作数据微调,结合强化学习,解决仿真与现实差距。

在具身智能的通用泛化能力构建方面,智源具身多模态大模型中心负责人、北京大学计算机学院助理教授仉尚航认为,构建具身快慢系统是具身智能从“单一任务/本体”迈向“通用泛化”的关键路径,分别以“大脑(推理)+小脑(控制)”的分层快慢系统和VLA端到端快慢系统两条技术路线,解决跨本体(如机械臂、人形机器人)与场景的泛化性问题。

北京邮电大学教授方斌表示,视触觉感知是具身智能从“感知”迈向“精准操作”的核心环节,需通过传感器创新、仿真数据增强与多模态融合,解决动态环境下的操作稳定性与泛化性难题。

关于具身智能的未来应用,智源研究院理事长黄铁军总结说,预计5-10年,具身智能有望代替人类从事不愿干、危险的劳动,但这并非终极目标,在更远的未来,具身智能有望全面超越人类,代表人类走向星际。

相关内容

热门资讯

2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...