千问灵魂林俊旸离职,算力围城里的天才大逃亡。
作者|栗子
“me stepping down. bye my beloved qwen.(我将卸任。再见,我亲爱的Qwen。)”
3月4日凌晨,阿里Qwen团队技术负责人林俊旸在自己的社交媒体上写下了这句颇显落寞与无奈的话。
短短十几个英文字符,不仅正式宣告了这位Qwen灵魂人物与阿里关系的终结,也引发了中国AI行业的巨大讨论。
要知道,如今的Qwen大模型,在世界开源AI模型领域都颇具竞争力。
3月2日晚间,阿里开源四款Qwen 3.5小尺寸模型系列。很快,埃隆·马斯克就点赞了这条社交媒体推文,并评论“Impressive intelligence density”(令人印象深刻的智能密度)。
然而,这一切都随着林俊旸的表态而充满变数。据晚点LatePost报道,有Qwen团队同事得知他将离职的消息后难掩情绪,“伤心地哭了”。
离开的不只有林俊旸。同一天,Qwen的后训练负责人郁博文也正式离职。他的工作将由今年初加入阿里通义实验室的前 DeepMind 高级资深研究员周浩接任。
一边是来自世界的点赞,一边是核心团队陆续出走。对于那些视Qwen为中国开源希望的开发者而言,这更像是一个深刻的追问:面对算力围城,那些AI天才们是否只有出走这一条路?
1.从语言学硕士到阿里最年轻P10
林俊旸并不是典型的AI人才,他的学术起点甚至会让你感觉有点“意外”。
2019年,他以北京大学外国语言学及应用语言学专业硕士的身份毕业,随后通过校招加入了阿里AI研究机构达摩院的智能计算实验室(现通义实验室前身),成为一名专注自然语言处理与大模型研究的算法专家。
从自然语言的底层逻辑和语言学本体切入大语言模型的研究,赋予了他对语言本质、跨模态表征对齐以及复杂指令工程更为敏锐的直觉。这种直觉在后续Qwen模型对多语种,特别是小语种的高质量支持中体现的淋漓尽致。
在阿里的六年岁月中,林俊旸的职级跃升堪称不可思议。
他仅用短短六年时间就从P6升级到P10。在2025年5月完成最近一次晋升时,年仅约32岁的他成为了阿里目前最年轻的P10专家之一。
而回望林俊旸在阿里的履历,几乎就是阿里AI大模型从早期探索者到现在领导者的记录。
因为他在Qwen团队中的实际角色不仅是管理者,更是核心架构的奠基人与关键代码的一线贡献者。
在通义千问正式立项之前,林俊旸就已经是阿里早期万亿级多模态大模型M6的核心研发成员及共同第一作者。而M6项目在2021年实现了十万亿参数规模的跨越,为阿里积累了早期极为宝贵的大规模分布式训练经验。
2022年,通义千问正式立项,林俊旸顺理成章地成为核心架构成员,并于同年正式升任该项目的技术负责人。在他的全面主导下,Qwen实现了从早期的雏形到Qwen 1.5、Qwen 2,再到2025年推出的Qwen 3系列的全尺寸开源爆发。
他不仅带队完成了从微型模型到旗舰混合专家模型的矩阵构建,还亲自统筹了Qwen-VL(视觉语言模型)、Qwen-Audio(音频理解模型)以及Qwen-Coder(代码生成模型)等关键垂直领域的突破。
在学术影响力方面,作为核心通讯作者之一署名的《Qwen Technical Report》系列文献,单篇引用量动辄突破数千次,帮助Qwen确立了在国际自然语言处理学术界的权威地位。
2025年10月,林俊旸更是在X平台上雄心勃勃地宣布,已在Qwen体系下组建了全新的“机器人与具身智能”极客小分队,让多模态模型从虚拟数据世界真正迈向物理交互世界。
无奈的是,即使是这样一位从应届生摸爬滚打成长起来、战功赫赫,且带领团队在全球最顶尖榜单上为公司斩获无数荣光的天才少年,最终也无法在庞大的商业化机器中保全自己所坚守的技术路线。
而这篇社交媒体,或许是他在挂印而去之前,为阿里巴巴AI版图描绘的最后一张具有宏大野心的技术蓝图。
2.为什么林俊旸会离职?
值得注意的是,林俊旸选择宣布离开的时机,恰逢阿里刚刚开源了Qwen 3.5系列的小尺寸模型、并在全球范围内获得马斯克等科技巨头点赞的次日。
这一时间点也许并非巧合,更像是团队内部矛盾积攒到一定程度的集中爆发。
据「甲子光年」了解,在此前Qwen的快速推进中,林俊旸一直极力试图在阿里内部维持一个“垂直整合”的研发闭环,覆盖从模型预训练、后训练与人类价值观对齐,直到底层基础设施优化的所有核心职能。
因为林俊旸认为,在前沿大模型探索进入深水区后,Scaling Law的红利正在递减,预训练、后训练以及Infra架构必须紧密咬合、协同创新,才能实现类似GPT o1那样在逻辑推理深度上的范式突破。
但也许这种想法并不被管理层接受。
据晚点LatePost报道,近期,通义实验室计划将Qwen团队分拆,从涵盖不同训练流程和模态的 “垂直整合” 体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,
尽管这些团队仍隶属通义实验室,但林俊旸的管理范围被缩小,而且更关键的是,这显然是对林俊旸坚守的技术路线的根本性否定。
与此同时,曾任职于Google DeepMind的高级资深研究员周浩在2026年初以“空降兵”的姿态加入阿里,直接向周靖人汇报,并顺势接手了另一位离职骨干郁博文留下的后训练团队核心业务,这显然进一步架空了林俊旸。
但这仅仅是表面现象,更深层的冲突在于“开源信仰”与“闭源变现”之间不可调和的博弈。
作为阿里AI战略版图中的重要棋子,高层对Qwen的期待始终处于分裂状态。
一方面,他们需要Qwen通过开源在国际社区赚取口碑,以此反哺阿里云的品牌价值,降低获客成本;
另一方面,商业化部门又时刻担心过于强大的开源模型会杀死自己的闭源生意——如果用户在本地就能部署高性能Qwen,谁还会去为昂贵的API接口和百炼平台的闭源模型付费?
这种既要开源带来的生态势能,又想守住闭源带来的直接利润的贪婪,最终让林俊旸这样的开源推动者陷入了腹背受敌的窘境。
高层对商业化的压力,传递到下面就变成了略显荒诞的内部考核体系。
据知情人士透露,内部管理层在巨大的商业变现压力下,竟然尝试引入DAU(日活用户数)、留存率等典型的C端消费级产品运营指标,来作为考核专注于底层基座模型研发的Qwen科研团队的核心KPI。
这种问题在于,当基座模型科研团队被迫背负DAU等短线数据增长指标时,团队的动作将不可避免地发生变形。为了完成季度KPI,研究团队不得不放弃那些需要漫长周期、极高失败风险的底层创新,转而去讨论如何通过调整语气来迎合某些业务部门的KPI指标。
这种“算力围城”里的损耗,在此时便成了无法忍受的生命浪费。
显然,当继续留在阿里推进顶尖开源研究的技术自治空间被彻底封死,林俊旸的离开便成了保留极客尊严的唯一选择。
3.天才的终点不应是围城
毋庸置疑,目前的Qwen早已超越了阿里内部技术底座的范畴,它是中国乃至整个非英语世界开源大模型生态中唯一的一面旗帜。
在Hugging Face等全球主流的开源模型托管平台上,Qwen的生态地位已经跨越了单纯的“强力参与者”阶段,演变为真正的“霸榜者”,甚至能够与世界顶级的闭源模型直接竞争。
比如2月16日,阿里巴巴开源的全新一代基座大模型Qwen3.5-Plus。
即使有媒体报道,阿里内部有高管对除夕夜亮相发布的 Qwen-3.5 并不完全满意,称其是一个 “半成品”。但却不能否认,其旗舰模型Qwen3.5-397B-A17B不仅在性能指标上正面硬刚谷歌Gemini 3 Pro与OpenAI GPT-5.2,更凭借一系列破坏性的技术指标重塑了全球开源生态的天花板。
只不过,Qwen能否继续自己在开源AI模型上的高歌猛进,从今天开始也许要打上一个问号。
事实上,在林俊旸离开之前,阿里大模型团队已有不少骨干离职。
2022年至今阿里AI核心团队离职统计,制图:甲子光年
这场人才的大规模出走,揭示了一个尴尬的现实:阿里似乎拥有全球最顶级的计算资源,却无法提供能够容纳这些天才灵魂的软性环境。
当核心人才不断向外部流失,他们带走的不止是技术本身,更是Qwen系列得以在激烈的全球竞争中保持敏锐嗅觉的“技术直觉”。
“Bye my beloved qwen。”
林俊旸的这句话,相信是自己对Qwen付出多年心血的真情流露。这种深情与决绝的并存,是中国AI行业最令人心碎的注脚。
Qwen曾是他心中的孩子。但在商业帝国的重力场下,一个天才的离职,竟然成了他保全技术信仰的最后一种仪式。
林俊旸的告别,或许只是一个新篇章的序幕。在那些为他流下眼泪的骨干成员心中,一颗种子已经种下:如果围城内无法通往AGI,那么未来的战场,必然在那片由天才们亲手开辟的、自由而残酷的荒野之上。
(封面图来源:“AGI-Next”峰会)