智源大会连甩1个大脑3个大模型4个智能体,图灵奖得主:2050机器智能将主宰世界
创始人
2026-06-12 21:05:28
0

智东西

作者 | 王涵

编辑 | 云鹏

智东西6月12日报道,今天,在智源大会2026上,智源研究院分享并发布了近一年以来的多项研究成果,包括基座大模型、智能体和基础软硬件生态三部分。

基座大模型方面,智源分享了原生多模态大模型悟界Emu3.5、AI药物发现模型悟界·OpenComplex 2.5等的研究进展,并在会上发布了神经科学模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神经科学领域数据集,以及全球最大的AI-Ready神经科学数据平台BrainToken

智能体方面,智源进一步介绍了其具身大脑悟界·RoboBrain Orca v0,发布了四款智能体产品,包括面向心脏疾病的辅助诊断智能体、面向科学发现的自主研究智能体、智源大会专属听会智能体有害蛋白识别智能体。在基础软硬件生态方面,智源发布众智FlagOS 2.1,该系统能够适配18家芯片厂商的32款芯片。

在大会开幕演讲中,美国工程院院士、2015年图灵奖得主Whitfield Diffie围绕AI安全提出:当前依赖反馈控制的方法效果不佳,他主张形式化方法才是未来,即先明确形式化规范、再编写程序、最后数学证明程序符合规范,他乐观认为未来AI将成为完成这些证明的工具,大幅提升可靠性。演讲尾声,Diffie给出惊人预测:到2050年,机器智能将超越人类,成为世界运行的主宰

图灵奖得主、马萨诸塞大学阿默斯特分校荣誉退休教授Andrew Barto,将强化学习归结为“控制、搜索与联想记忆”的三位一体,指出“机器学习最初就是强化学习”。他强调强化学习与神经网络研究从一开始便紧密交织,深度强化学习结合大脑奖励系统的最新成果将指引下一轮方向。最后他警示:奖励信号设计可能带来“反常实例化”风险。

在播客环节,中国工程院院士、阿里云创始人王坚智源研究院理事长黄铁军展开对话,围绕中国大模型的发展路径展开,重点讨论了从追赶验证到路线选择、体系构建与范式创新的转型,如何突破互联网文本数据的天花板和算力短缺的极限,以及如何从“跟随国际主流范式”转向“形成自身问题意识”、实现原创范式跃迁。

在智源研究院院长王仲远主持的圆桌对话中,小米罗福莉、清华朱军、清华刘知远、南洋理工安波四位专家进行了近50分钟的深度交流。

罗福莉认为引发热议的Claude Fable 5本质仍是预训练、数据与强化学习持续推进的自然结果;朱军指出新版模型Token消耗下降是正确方向;刘知远分析Anthropic的成功源于找准代码这一专业领域,并强调智能革命在于用AI替代机械重复的脑力劳动;安波则提出AI自进化不能依赖封闭环境。

一、 “悟界”登《Nature》,发布全球最大最全的神经科学数据集

智源研究院院长王仲远分享了近一年来智源研究院的相关研究进展。

基座大模型方面,智源研发的原生多模态大模型悟界Emu3.5,在去年10月30日就已经正式发布并且开源。今年1月份,悟界·Emu正式登上《Nature》正刊,也是国内多模态大模型方向的第一篇

悟界·Emu3.5通过Next-Token Prediction这一实现方式,实现了文本、图像、视频的统一学习,实现了多模态理解任务和多模态生成任务的统一学习。

智源将Next-Token Prediction扩展到了神经科学领域,研发出了悟界·Brainμ1.0,该模型能够将脑信号与其它模态互相转化,可以将脑信号转成文字、图像、声音,同时可以反过来转换。

同时,智源发布了全球最大最全的AI-Ready神经科学领域数据集,以及全球最大的AI-Ready神经科学数据平台BrainToken。

此外,智源还发布了悟界·OpenComplex 2.5,是可泛化物理支持的下一代AI驱动药物发现模型。通过单一的流程,该模型覆盖了制药的四大关键步骤,包括口袋识别、反向筛选、结构预测、形成力预测。OpenComplex 2.5在多个benchmark上的核心指标,超过了传统的物理方法和其他的AI模型。

二、提出世界模型四类技术路线,自研世界模型即将开源

世界模型方面,智源将当下世界模型的技术路线分为四类

1、第一类是语言为中心的世界模型,包括VIMA等。

2、第二类是以像素为中心的视觉模型,如Sora。

3、第三类是以三维结构为中心的视觉模型,代表是李飞飞团队成果。

4、第四类是以视觉表征为中心的世界模型,像是杨立昆团队成果。

王仲远分享称,智源认为,以上四类技术路线距离真正的世界模型还存在一定差距。智源正在研发当中的世界基座模型——悟界·Physis v0.1。该模型具有AI底层典型四大核心能力:物理一致性、动作灵活性、长程可推演、通用泛化性。其通过为理前的空间建模,能够真正实现全模态的输入,以及下一步物理状态的预测。

该模型目前还在训练中,将在未来几个月开源。

三、发布具身大脑,推出四款智能体

具身智能方面,王仲远透露,智源最新研发的具身大脑悟界·RoboBrain Orca v0,是以下一个物理状态预测为核心的具身大脑。它通过融合大量的多模态交互数据,强化了世界模型在具身上的表征,提升下游少量样本泛化能力,目前已与50余家企业进行了合作。

智能体方面,王仲远在现场发布了四款智能体产品,包括:

1、面向心脏疾病的辅助诊断智能体:BAAI Cardiac Agent

该智能体是智源智源与安贞医院共同研发的,能够有效识别和处理心脏磁共振的多模态数据,提升医生的诊断效率。其心脏疾病诊断的精确度,能够达到安贞医院顶尖心血管医生的诊断水平

2、面向科学发现的自主研究智能体:AREX

该智能体能够覆盖科学研究的几个关键环节,包括信息调研、方案设计、实验探究、报告撰写。其背后所依赖的基座模型由智源自主研发。在权威的基准测试上,不仅能够显著超越同等参数的开源模型,更能够比肩万亿参数级别的旗舰模型。

3、本届智源大会专属的听会智能体:SoulAgent

该智能体可以帮助参会者实现智源大会一站式参会体验,同时也能够与先期入驻的智源大会的专家进行AI问答。

4、面向有害蛋白获取的风险发现智能体

智源首次通过红队实验的方法验证:智能体能够辅助筛查并获取有害的蛋白,进而合成蛋白,将在近期公布相关的测试报告。

四、FlagOS更新至2.1版本,适配32款芯片

在基础软硬件生态方面,王仲远介绍,智源研究院联合开源社区打造的众智FlagOS 现已更新至 2.1 版本。该系统适配18家芯片厂商的32款芯片,是目前全球适配芯片品类最多的计算系统

FlagOS内置算子超600个且数量仍在持续扩充,不仅为18家芯片厂商提供统一AI编译器、为12家厂商提供通用技术支持,还同时完成国际标准与国家标准立项。

目前该系统可支撑90%以上主流开源模型部署,近期已完成DeepSeek、千问、MiniMax、MiniCPM、混元等多款热门模型的无缝适配。

结语:AI技术发展,已经迎来拐点

本届智源大会释放出多项行业动向。

首先,AI研究方向日趋多元,行业不再单纯追逐模型参数规模,逐步向脑科学、药物研发、心脏疾病诊断等实体应用领域深耕。其次,基础软硬件生态落地提速,众智FlagOS已实现对32款芯片的适配,底层技术布局初见成效。

此外,两位图灵奖得主与国内专家在分享中形成共识:随着AI技术持续演进,仅依靠算力与数据堆砌已难实现长远发展,技术路线规划、安全体系搭建以及人机协同关系等核心议题,亟待全行业深入探索与正视。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...