AI大模型周报:阿里智谱密集发新品,月之暗面传上市
创始人
2026-04-10 20:17:42
0

4月1日至4月10日,国内AI大模型行业进入密集发布期。阿里在一周内连推三款重磅模型,智谱发布全球首个8小时持续工作开源模型,字节跳动上线全双工语音大模型,腾讯确认混元3.0将在本月发布。

视频生成赛道同样热闹,即梦突然涨价,阿里系神秘视频模型空降榜首,垂直领域医疗、金融、法律等专业模型也动作频频。

行业竞争焦点正从参数规模比拼转向工程化落地和Agent能力构建,定价逻辑也在悄然改变,从年初“降价换市场”逐步转向“性能锚定价格”。

1.阿里:一周三连发,Qwen3.6Plus登顶全球调用榜

阿里在过去一周成为模型发布最密集的国内厂商。3月30日,通义团队发布全模态原生大模型Qwen3.5-Omni,在长上下文、多语言、音视频理解能力上实现明显提升,新增了语义打断、音色克隆、语音控制等实时交互能力,在215项任务中刷新SOTA纪录。

4月1日,通义团队推出Wan2.7-Image,一款AI图像生成与编辑模型,在视觉还原度、光影逻辑及语义遵循上的表现被评价为国产同类中最接近全球顶尖水平。

4月2日,阿里千问正式推出Qwen3.6-Plus,千问3.6系列首款旗舰大模型,主打智能体Agent、编程Coding和工具调用能力。该模型在多项权威编程评测中均超越参数量是其两倍乃至三倍的GLM-5、Kimi-K2.5等竞品,成为国产模型中编程能力的标杆。

官方称其为“当前中国编程能力最强的大模型”,在SWE-bench智能体编程基准中表现领先,在Claw-Eval真实世界智能体任务中端到端完成率显著提升。Qwen3.6-Plus支持100万Token超长上下文,总参数3970亿但推理仅激活170亿,兼顾性能与成本。

4月2日当晚,Qwen3.6-Plus正式版上线OpenRouter,调用量激增711%,单日调用量突破1.4万亿Token,直接登顶全球模型调用榜。

阿里在这一波密集发布背后的组织调整同样值得关注。据36氪报道,阿里巴巴新成立的ATH事业群运转仅两周,便完成了上述三款模型的连续发布。此前千问3.5于2026年2月发布,不到一个半月即演进到3.6版本,迭代明显加速,性能更强的旗舰模型Qwen3.6-Max也将在近期发布。

2.智谱:GLM-5.1正式开源,国产模型首次价格对齐国际头部

4月8日,智谱正式发布新一代开源模型GLM-5.1,并宣布正式开源。二级市场上,港股开盘后智谱大涨,一度涨近18%,股价触及925港元。

GLM-5.1是全球第一个在真实工程任务中验证了8小时持续工作能力的开源模型。有别于当前以分钟级交互为主的模型,GLM-5.1能够在单次任务中持续自主地工作长达8小时,过程中自主规划、执行、测试,碰壁时主动切换策略,出错后自行修复,最终交付完整的工程级成果。

在性能上,GLM-5.1大幅提高了代码能力,在SWE-bench Pro、Terminal-Bench、NL2Repo三大代码评测基准的综合平均分中取得全球第三、国产第一、开源第一的成绩,在最接近真实软件开发的SWE-bench Pro基准测试中实现国产模型首次超越Opus 4.6。

在GPU内核优化这一传统上高度依赖专家经验的领域,GLM-5.1在涵盖50个真实机器学习计算负载的KernelBench Level 3优化基准上,经过超过24小时的不间断迭代,取得3.6倍的几何平均加速比,显著高于传统编译优化模式。

伴随新品上线,模型聚合平台OpenRouter监测显示,智谱GLM全线提价10%。调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet4.6水平。

这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐,一年前国产大模型厂商还在以降价90%以上争夺市场份额。

智谱创始人兼CEO张鹏此前在2025年全年业绩发布会上表示,2026年一季度智谱API调用定价提升83%,即便如此,市场依然供不应求,调用量增长400%。智谱2025年全年总收入达到724.3百万元,同比增长131.9%。

3.字节跳动:推出全双工语音大模型Seeduplex

4月9日,字节跳动推出原生全双工语音大模型Seeduplex,目前已全量上线豆包App。该模型基于“边听边说”的全新框架设计,相比上一代半双工端到端语音模型,实现了听与说同步的实时交互,在对话节奏、自然度和抗干扰能力上有所提升。

官方介绍,Seeduplex通过模型架构创新与训练优化,攻克了高并发下的卡顿与稳定性等工程挑战。复杂场景下,误回复率和误打断率较半双工模型减少50%,抢话比例下降40%,判停表现提升8%。多维度评测显示,Seeduplex在对话流畅度和节奏感上均显著优于传统半双工方案及行业主流App的语音通话功能。

豆包大模型日均Token使用量已突破120万亿。2026年央视春晚,豆包视频生成模型Seedance 2.0和图像创作模型Seedream 4.5也提供了视觉内容制作的技术支持。

4.腾讯:混元3.0定档4月,姚顺雨领衔新模型引关注

腾讯本周释放了关于混元3.0的明确信号。腾讯副总裁、政企业务总裁李强在4月1日透露,腾讯在2025年底完成重大组织架构调整,新设立AI团队、infra团队与数据计算平台部,同时引入前OpenAI高级研究员姚顺雨带队混元大模型团队,明确将于4月发布混元3.0版本。

汤道生4月7日进一步披露,混元3.0一方面激活参数大幅降低,另一方面在复杂推理、长记忆、长文、多轮追问与Agent能力等多个维度有明显提升,在元宝中做实验测试正向收益非常明显。

腾讯云在AI工程化方面的布局同步推进。汤道生强调,“AI落地不只是一道算法题,更是一道工程题”,腾讯要全面强化模型的Harness与工具。

腾讯云已推出智能体开发平台ADP、安全沙箱等基础设施,并将验证过的Agent能力从研发场景延伸到通用办公场景。

关于行业竞争,李强称与龙虾相关的Agent行业才刚刚起步,“百虾大战”是行业发展必然阶段,市场最终会向真正关注产品、拥有强技术能力的企业集中。

在商业化层面,腾讯云3月结束GLM 5、MiniMax 2.5、Kimi 2.5等第三方模型的免费公测,将自研混元模型HY2.0 Instruct的输入价格从每千词元0.0008元上调至0.004505元,标志着国产模型从价格战转向理性定价。

5.MiniMax:确认2.7模型开源,发布Agent命令行工具

MiniMax本周迎来两件大事。4月7日,MiniMax官方在Huggingface社区透露,预计本周末正式发布MiniMax 2.7开源版本。官方对开源延期表示歉意,称低估了开源所需的工作量,目前仍在执行基础设施适配工作。

M2.7于3月18日发布,距离春节前发布的M2.5只过了一个月多,迭代速度极快。在基准测试SWE-Pro中得分56.22%,接近Opus最好水平;在GDPval-AA的ELO得分为1495,为开源模型最高。

4月9日,MiniMax发布专为AI Agent设计的命令行工具MMX-CLI。接入后,Agent可以在Claude Code、OpenClaw等主流开发环境中,实现对MiniMax最新全模态模型的原生调用,无需适配繁琐接口,也无需额外编写MCP Server。MMX-CLI覆盖编程、视频生成、语音合成、音乐创作等全模态能力。

此外,根据行业消息,Kimi和MiniMax的模型服务营收占比已有所提升,MiniMax模型服务营收已占公司总收入约三分之一。

6.月之暗面:被传赴港IPO,商业化爆发后迎生存考验

4月9日,月之暗面被传正处于赴港上市的早期考量阶段。值得注意的是,创始人杨植麟此前曾表示公司现金流良好、短期不急于上市,态度转变背后有深层次原因。

Kimi K2.5上线20天内收入达到2.4亿美元,已超过2025年全年的总和。但这一增长高度依赖OpenClaw生态,一旦外部热度下降,调用量可能快速回落。

QuestMobile数据显示,2025年末Kimi月活从2165.3万腰斩至902万,而豆包、千问、元宝、DeepSeek等大厂应用月活纷纷破亿。

行业残酷的“二八定律”正在显现,80%的流量集中在20%的头部应用中。长文本这一Kimi的核心优势已被字节、阿里迅速追平。

估值层面,智谱和MiniMax估值已双双升至约400亿美元,留在一级市场的月之暗面估值约180亿美元,存在潜在估值倒挂风险。

有分析指出,如果不上市,后续融资将面临估值打折的风险,上市反而能为投资人提供关键的退出通道。

7.百度:文心一言4月1日起全面免费

4月1日零时起,百度文心一言正式面向所有PC端和APP端用户免费开放。此前,百度于2月13日即宣布了这一计划,3月16日发布文心大模型4.5及文心大模型X1,其中文心大模型4.5是百度首个原生多模态大模型,API调用价格仅为GPT-4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调用价格约为R1的一半。

百度还宣布将在6月30日正式将文心大模型开源,并在下半年发布文心大模型5.0。与此同时,文心一言上线深度搜索功能,具备更强大的思考规划和外部工具调用能力。

8.垂直模型:医疗、金融、具身智能各显神通

本周垂直领域大模型动作频繁。4月8日,北电数智联合北京清华长庚医院发布全国首个AI合理用药大模型“清智”,突破传统规则审方系统局限,以“大模型技术+智能体”双引擎驱动,搭建了“检索-推理-生成-溯源”的智能审方链路,实现了针对多药共用、多病共存等高复杂场景的精准应对。该模型已率先在院内投入临床应用,推动用药模式从“千人一药”走向“千人千方”。

金融领域,蚂蚁数科于4月1日发布百灵企业版Ling-DT-Fin-Mini 2.5,一款总参数16B、激活参数1.4B的轻量级MoE模型,基于Ling 2.5最新的混合线性注意力架构,针对金融领域高并发、低时延的任务场景进行优化,推理速度快了100%,处理同样的任务量硬件成本显著降低。

具身智能领域,4月9日智元机器人正式发布新一代具身基座大模型GO-2,首次在统一架构中打通从逻辑推理到精准动作执行的“最后一公里”,结合数万小时的数据训练,在多个机器人基准测试中刷新行业SOTA,让机器人从“黑盒摸索”迈向真正的“知行合一”。

此前两天,4月7日OpenCSG发布了国内首个矿冶行业垂直大模型数据集CIMD,38万+条记录,覆盖法律法规、学术论文、行业报告、市场数据、舆情信息五大维度,填补了中文垂直领域语料空白。

4月8日,高德宣布全量开源具身操作基座模型ABot-M0,这是全球首个基于统一架构的机器人具身操作基座模型,可实现一个“通用大脑”适配多种形态的具身机器人。

该模型在多个权威基准测试中实现SOTA,在Libero-Plus基准上任务成功率达80.5%,较业界标杆方案Pi0提升近30%。

开源涵盖数据、算法与模型三大维度,其中UniACT数据集整合超过600万条真实操作轨迹,为目前规模最大的通用机器人数据集。

9.视频生成赛道:即梦涨价8倍,阿里HappyHorse空降榜首

视频生成模型赛道本周出现剧烈波动。4月9日前后,字节跳动旗下即梦AI调整会员价格,围绕首充价格和会员积分发放两个维度进行提价。此前首次充值五折优惠上调至六折,每档会员每年多交500元,标准会员积分直接砍半,高级会员从每月15000积分降至5870积分。

有创作者计算,制作一段2分钟视频的成本从过去的5.2元上涨至40.2元,直接翻了8倍。这是即梦本月内第三次价格调整。

业内人士分析,算力是卡住工具和创作者的主要原因,Seedance 2.0全量开放第一天排队时间就达到8-10小时,字节用价格调整来缓解算力压力。

就在即梦涨价的同一时间,一款名为HappyHorse的视频生成模型空降AI评测分析平台Artificial Analysis的榜首,引发行业热议。钛媒体App确认,该模型由前快手副总裁、可灵技术负责人张迪带队,他去年11月刚回归阿里。

HappyHorse在文本转视频纯视频生成分类中Elo积分高达1347,超出Seedance 2.0达74分。值得注意的是,HappyHorse-1.0的API尚未开放,业内人士透露榜单测试存在人为操作空间,先打榜再认领的套路在行业里并不新鲜。

10.算力与安全:DeepSeek V4临近发布,伦理风险持续发酵

算力层面,本周最受关注的消息是DeepSeek V4预计4月发布,并已完成对华为、寒武纪等最新国产AI芯片的优化。据业内消息,DeepSeek已向华为即将推出的芯片下达总计数十万片的批量订单。

若消息属实,这代表中国人工智能产业在算力自主化方面取得实质性进展,可能重塑全球AI技术竞争格局。此外,2026年3月中国大模型日均Token调用量突破140万亿,两年增长超千倍,商业化落地加速。

安全与伦理层面,国家知识产权局近日发布风险提示,OpenClaw等智能体工具被曝光默认安全配置脆弱,易引发严重安全风险。

4月8日有专家公开表示,企业在引入和应用AI技术时,必须高度警惕算法歧视、隐私侵犯、资源消耗等科技伦理风险。

4月7日有媒体测评发现,部分主流大模型可被多轮渐进式对话诱导,输出还原用户真实身份,甚至扒出疾病、财产等高度敏感信息。

AI首次“核泄漏”事件也在本周持续发酵,Anthropic的一个低级失误在AI发展的历史长河中投下巨石,涟漪正在扩散。

11.市场数据与其他动态

Token用量已成为衡量大模型行业热度的重要指标。截至2026年3月,中国AI大模型日均Token调用量已突破140万亿,较2024年初增长超千倍。OpenRouter平台数据显示,2026年3月30日至4月5日,平台token调用量为27T,环比增长18.94%,国产模型占领前五名,Qwen3.6 Plus登顶。

企业内部动态方面,据InfoQ报道,美团内部不允许使用Qwen模型;月之暗面将授予尚未毕业的实习生公司期权;小米要求全体研发人员进行AI考试;字节Seed启动大模型校招,全球招募百位AI人才。

产业政策层面,广东省备案大模型数量已达132款。4月9日,广西发布钢铁行业大模型“玄铁”。云服务价格层面,3月腾讯云结束第三方模型免费公测,上调混元模型价格;阿里云此前也已宣布AI算力与存储产品涨价,最高涨幅34%。

12.总结

过去一周的AI大模型行业,国内头部厂商呈现出清晰的分化路径。阿里以周更节奏密集发布多模态、编程、图像生成模型,Qwen3.6Plus以调用量登顶验证了国产模型的市场竞争力。

智谱GLM-5.1以“8小时持续工作”定义模型新标准,并率先实现国产大模型价格与国际头部厂商对齐;字节用全双工语音模型刷新实时交互体验;腾讯混元3.0定档4月,AI工程化战略浮出水面;MiniMax以开源+Agent工具双线出击;月之暗面则在商业化爆发后直面盈利模式和IPO抉择。

垂直赛道同样不平静,医疗、金融、具身智能均有新模型发布,视频生成赛道竞争加剧,即梦涨价与阿里HappyHorse上榜让市场格局充满变数。行业竞争已从参数比拼转向更实际的能力维度:长程任务执行能力、Agent工程化水平、定价逻辑重构以及商业化可持续性。

算力成本持续下探和Token用量高速增长为行业提供了扩张空间,但月之暗面月活腰斩与调用量下滑揭示了一个残酷事实,技术能力不等于用户留存,大模型公司的商业考验才刚刚开始。

[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...