阿里,重磅发布!股价大涨
创始人
2025-03-06 16:01:38
0

开源浪潮,仍在持续。

3月6日,阿里通义千问大模型团队宣布,正式推出最新的推理模型QwQ-32B。据通义千问大模型团队介绍,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。

值得注意的是,尽管DeepSeek-R1拥有6710亿的巨型参数量,但由于DeepSeek创新性地使用了MoE(混合专家模型)架构以及MLA(多头潜在注意力机制)的方法,每次推理仅激活370亿参数(占总量的5.5%)。这使得DeepSeek-R1虽然整体很大,但实际干活时只需要动用一小部分力量,能够做到节省资源,高效完成任务。

在数学推理、编程能力和通用能力的一系列基准测试中,通义千问大模型团队将QwQ-32B与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较,结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

至于为何能够实现这一点,奥秘仍在于大规模强化学习的方法。据介绍,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习。在初始阶段,特别针对数学和编程任务进行了强化学习训练。与依赖传统的奖励模型不同,通义千问大模型团队通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行服务器评估生成的代码是否成功通过测试用例来提供代码的反馈。

业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。

此外,QwQ-32B的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。

目前,阿里已采用宽松的Apache2.0协议,将QwQ-32B模型向全球开源,所有人都可免费下载及商用,也可以通过阿里云百炼平台直接调用模型API服务。同时,用户也可通过通义APP免费体验最新的QwQ-32B模型。

最近,阿里在模型开源方面动作频频。就在2月底,阿里才宣布全面开源旗下视频生成模型万相2.1模型。这款模型同样基于Apache2.0协议,14B和1.3B两个参数规格的推理代码和权重全部开源,同时支持文生视频和图生视频任务。

开源仅不到一周的时间,通义万相2.1模型就受到了开源社区的极大欢迎。3月3日,开源社区Hugging Face最新榜单显示,阿里万相大模型已反超DeepSeek-R1,登顶模型热榜、模型空间榜两大榜单,成为近期全球开源社区最受欢迎的大模型。

据了解,阿里通义团队一直坚持开源路线。从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解和生成模型、语音理解和生成模型、文生图及视频模型等,覆盖从0.5B到110B等参数,实现了全模态、全尺寸大模型的开源。

长江证券研报指出,近期,阿里在AI 领域持续发力,践行了其AI 驱动战略,随着其后续投入的逐步提升,相关成果有望加速迭代,相关成果或将惠及相关产业链,加速AI应用落地,进而进一步带动算力需求的爆发。同时,随着阿里在AI 基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入,或将引领中国AI 产业加速发展。

资本市场方面,隔夜阿里巴巴美股大涨超8%,今日,阿里巴巴港股大幅高开,一度涨超7%,截至发稿,涨6.47%。今年以来,阿里巴巴股价大幅上涨,累计涨幅已近70%。

责编:万健祎

校对:姚远

相关内容

热门资讯

vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
iPhone 16系列手机网速... 在智能手机的世界里,网速往往是衡量一部手机性能的重要指标之一。 尤其是随着5G时代的到来,用户对于高...
原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
小米怎么去除抖音水印保存?分享... 随着抖音的普及,越来越多的人喜欢在抖音上分享和观看短视频。当我们想要保存一些喜欢的视频时,往往会被视...
舒福德智能床S300 Pro面... 8月13日,以“一键入眠 世界领先”为主题的舒福德智能床新品发布会在浙江嘉兴举行。中国睡谷的首次对外...
邓宏魁、张涛、李亚栋、孙斌勇获... 出品 | 搜狐科技 作者 | 周锦童 8月16日上午10时,2024未来科学大奖新闻发布会在北京、香...
小米14T Pro海外定档9月... 【ITBEAR】9月23日消息,小米今日在X平台上宣布,旗下新款手机小米14T Pro定于9月26日...
如何规划小红书矩阵号内容并一键... 小红书矩阵号内容规划与抖音多账户同步攻略 在当前社交媒体时代,内容营销已成为品牌推广和个人IP打造的...