研究团队新发现:AI大模型看“块头”更要看“密度”
创始人
2025-11-24 06:20:43
0

新华社记者 魏梦佳

近年来,AI的发展遵循着一个简单直接的规则——模型越大、能力越强。这个被称为“规模法则”的路径,催生了今天我们看到的各种强大的AI大模型。但同时,随着模型参数量的增大,模型训练的成本、使用的成本也随之飙升,一定程度上制约了大模型的产业应用进程。

清华大学的一项最新研究成果——大模型“密度法则”20日在国际期刊《自然·机器智能》上作为封面文章发表,为AI发展指出了一个新方向:AI大模型变强,不应只靠“体型”,更要靠“密度”。

“过去,我们往往关心一个AI模型的‘块头’有多大,即参数量有多大,其实我们更应该关心模型的‘能力密度’,即每个单位的参数能展现出的智能水平。”论文第一作者、清华大学计算机科学与技术系助理研究员肖朝军说,“这就好比评价一个武林高手,不是看他块头有多大,而是看他一招一式里蕴含了多少功力。”

研究人员表示,实现这样的“能力密度”,不能靠“模型压缩”。研究发现,强行压缩一个大模型,就像是把一本厚厚的字典强行塞进小本子里,很多内容会丢失,导致“智力”下降,因此需要采用更先进的“数据+算力+算法”体系,才能培养出“高密度”的精干小模型。

通过研究过去几年发布的51个开源大模型,研究人员发现:AI大模型的“能力密度”正以指数级速度增长,大约每3.5个月就翻一倍。

这意味着什么?打个比方,如果今天我们需要一个体育馆大小的“大脑”才能完成某项复杂任务,那么约3个半月后,我们只需要一个客厅大小的“大脑”就够了;再过3个半月,这个“大脑”可能只需要一个背包大小。

据了解,目前,清华大学已与AI企业面壁智能的团队合作推出了系列“高密度”模型,已应用于手机、汽车、智能家居等生活领域。

“AI模型不是越大越好,‘精炼’‘高效’是其未来发展的方向。”肖朝军说,强大的AI大模型在未来将会更广泛地在手机、电脑、汽车等终端上运行。当芯片的计算能力和AI的智能密度这两条快车道交汇时,“端侧智能”的时代或将来临。届时,个人设备有望拥有前所未有的智能,不仅反应更快,还能更好地保护个人隐私。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...