新智元报道
编辑:定慧
【新智元导读】《自然》评出年度十大科学人物,DeepSeek梁文锋和中国科学院深海科学与工程研究所研究员杜梦然入选。
刚刚,梁文锋入选《自然》2025年度十大人物榜单!
Nature给出的评语是:科技颠覆者!
正式报道中,则用「这位 中国金融奇才的 DeepSeek AI模型惊艳了世界」。
今年1月,中国的一则公告震撼了人工智能界!
同时,Nature也用「让科学家感到兴奋」为标题进行了专题报道。
DeepSeek公司突然发布了功能强大但价格低廉的R1模型——瞬间证明美国在人工智能领域的领先优势并不像许多专家想象的那样巨大。
这则爆炸性公告的背后是40岁的前金融分析师梁文锋。
据信他此前通过将人工智能算法应用于股市赚取了数百万美元,并于2023年用这笔资金在杭州创立了DeepSeek公司。
梁文锋行事低调,仅接受过少数几家中国媒体的采访(并且他 拒绝了《自然》杂志的采访请求)。
DeepSeek和他本人的低调神秘形成了鲜明对比。
R1是一款推理大语言模型(LLM),擅长通过将复杂任务分解为步骤来解决数学和编程等难题。
它是首个以开放权重形式发布的此类模型,意味着研究者可以免费下载并基于此模型进行开发,这为希望将算法适配到自身领域的研究人员带来了福音。
DeepSeek的成功似乎促使中美其他公司纷纷效仿,相继发布了各自的开源模型。
尽管R1在多项能力上与美国顶尖模型(包括驱动ChatGPT的模型)不相上下,但人工智能专家指出,其训练成本远低于竞争对手。
例如,Meta的Llama 3 405B模型的训练成本就高出十倍以上。
DeepSeek对透明度的追求还体现在:去年9月该模型成为首个接受同行评议的主流LLM时,公司完整公布了构建和训练R1的技术细节。
通过公开其配方,DeepSeek为其他AI研究者提供了训练推理模型的宝贵经验。
总部位于纽约的社区人工智能平台HuggingFace研究员Adina Yakefu表示:「从许多方面来看,DeepSeek已经产生了巨大影响力。」
梁出身于广东一个乡村,父母都是小学教师,这样的成长环境与如今AI领域的高峰相去甚远。
高等教育将他带到了杭州的顶尖学府浙江大学,并于2010年获得工程学硕士学位;他的论文涉及设计算法来追踪视频中的物体。
很快,他将对人工智能的热爱应用于金融市场,并于2015年联合创立了对冲基金高飞资本(High-Flyer),随后在2023年分拆出DeepSeek公司。
当时,中国在开发LLMs方面面临障碍。
美国的出口管制阻止了中国公司购买某些由美国芯片制造商英伟达生产的强大计算机芯片,即图形处理单元(GPU),这些芯片适合训练LLMs。
但梁文锋早已储备充足。
出于对能在这些芯片上进行何种研究的好奇心,他在过去十年里购买了1万块英伟达GPU。
在2023年接受中国媒体公司36氪采访时,他将这些购买行为比作有人为家中购买钢琴:买得起,而且有一群人渴望在上面演奏音乐。
与许多西方人工智能企业家一样,梁将目光投向了实现通用人工智能——即能在认知任务上与人类相媲美的AI系统——并围绕这一目标塑造了他的公司,前DeepSeek研究员Benjamin Liu表示。
公司在招聘时更看重个人潜力而非经验水平(DeepSeek R1论文的一位作者仍在读中学),且组织架构扁平化,研究人员可自主决定研究方向。
据悉梁深度参与研究工作,即使像我这样的实习生也被视为承担重要职责的正式员工,Benjamin Liu说道。
公司外部的研究人员对DeepSeek的运营方式印象深刻。
专注于人工智能安全的咨询公司Concordia AI的国际人工智能治理负责人Kwan Yee Ng表示,DeepSeek没有利用其知名度追求商业成功,而是始终致力于解决人工智能研究中相当困难的基础性问题,这令人瞩目。
DeepSeek模型已深度融入中国人的生活:地方政府正利用它们运营聊天机器人热线、协助市民填写表格,每天更有数千万人通过国内社交媒体平台微信使用这些模型。
这一趋势部分得益于政府推动人工智能通过智慧城市、医疗保健等各类应用融入经济发展。
据梁文锋及其他中国研究人员称,DeepSeek已成为国家形象转型的象征——从卓越的模仿者蜕变为真正的创新者。
这种转变真实存在,且正在加速,DeepSeek研究员Yu Wu表示。如今全球正热切期待该公司即将推出的下一代推理模型R2,据传该模型因硬件与训练数据问题已推迟发布。
可以确信的是,梁文锋的公司计划向世界免费开放R2。
我们承诺永久开源,Yu Wu强调道。
Nature's 10另外9位入选者
《自然》年度十大人物榜单旨在记录一年中的重要科学趋势与发现,并讲述相关人物的故事。
该榜单由《自然》编辑团队编纂,旨在彰显那些塑造世界格局的最具影响力研究与重大进展。
在这份榜单中,梁文锋被誉为「科技颠覆者」。《自然》称他创立的中国人工智能企业开发出DeepSeek大语言模型「震惊了世界」,「这一开源模型对科学家们来说无疑是一大福音」。
上榜的还有另外一位国人。
中国科学院深海科学与工程研究所研究员杜梦然被《自然》称为「深潜者」,榜单强调她在海平面9000米以下发现了地球上最深的动物生态系统,在海洋最底层「见证科学界前所未有的景象」。
她驾驶「奋斗者」号潜水器深入海面下9000多米的千岛-堪察加海沟(Kuril-Kamchatka Trench),首次在该深度的海沟底部发现了充满奇异生物的生态系统,拓展了人类对深海生命的认知。
其他入选的有:
Susan Monarez:美国微生物学和免疫学科学家
作为首位经参议院确认的CDC主任,她在任期内因拒绝在缺乏科学证据的情况下批准疫苗建议,并拒绝无故解雇科学家,最终被解除职务。她因在政治压力下坚守科学诚信和原则而受到关注。
Achal Agrawal:揭露印度高校惊人论文撤稿率的学者
他致力于揭露学术界(尤其是印度国内)的科研诚信问题,曝光了大量虚假论文和学术不端行为,并推动了印度高等教育机构在科研评估政策上的改革。
Tony Tyson:打造全新维拉・鲁宾天文台望远镜的先驱
他是智利薇拉·鲁宾天文台(Vera C. Rubin Observatory)及其巨型数码相机项目的核心推动者。
这台耗资8.1亿美元的望远镜将开启对宇宙的全新观测,有望在暗物质和暗能量研究上取得突破。
Precious Matsoso:促成全球首份《大流行病条约》的谈判者
作为核心谈判代表,她在地缘政治紧张的局势下,成功促成了全球首个大流行病防范条约(pandemic-preparedness treaty)的达成,旨在加强各国在未来面对大流行病时的合作与应对能力。
Sarah Tabrizi:一直在攻克毁灭性脑疾临床前线的亨廷顿舞蹈症斗士
她领导的团队在亨廷顿舞蹈症(Huntington's disease)的治疗上取得了关键进展。她们测试的一种新疗法成功减缓了这种致命神经退行性疾病的临床进展,为患者带来了曙光。
Luciano Moreira:为巴西抗击疾病而培育数十亿只蚊子的培育者
他领导了一项大规模计划,在巴西建立了巨型「蚊子工厂」,通过释放感染沃尔巴克氏体(Wolbachia)的蚊子来阻断登革热等病毒的传播,为抗击热带传染病做出了巨大贡献。
Yifat Merbl:在细胞垃圾中发现免疫系统从未展现一面的肽链侦探
她发现了人类免疫系统的一个全新层面。她的研究揭示了细胞内的「垃圾处理站」——蛋白酶体(proteasomes)实际上能将蛋白质切割成具有抗菌功能的肽段,从而帮助机体抵御感染。
KJ Muldoon:接受全球首例高度个性化CRISPR基因编辑治疗的婴儿
她是世界上首位接受「超个性化」CRISPR碱基编辑疗法的患者。KJ天生患有致死性的氨甲酰磷酸合成酶1(CPS1)缺乏症,这种疗法为治疗罕见遗传病开辟了新的希望。
参考资料:
秒追ASI