又一国产大模型刚刚开源!能使唤机器狗拿水
创始人
2025-12-27 02:21:55
0

来源:市场资讯

(来源:智东西)

智东西

作者 陈骏达

编辑 心缘

MiniMax最强编程模型开源了!

智东西12月26日报道,今天下午,MiniMax开源了其本周二发布的MiniMax M2.1模型,该模型主打编程能力和办公场景的可用性,在多语言编程、Agent、复杂指令方面都有明显提升。

MiniMax M2.1采用MoE(混合专家)架构,参数量为229B,激活参数量为10B,与此前开源的MiniMax M2一致。

在编程相关场景的核心榜单上,MiniMax M2.1相比于前代模型MiniMax M2的得分最高提升了60%(Terminal-bench 2.0)。尤其是在多语言场景上,MiniMax M2.1的表现甚至超过了Claude Sonnet 4.5和Gemini 3 Pro,并接近Claude Opus 4.5。

此外,为了考察模型“从零到一”构建完整、可运行应用程序的全栈能力,MiniMax构建并开源了全新基准测试VIBE。MiniMax-M2.1在VIBE综合榜单中拿到88.6的平均分,得分接近Claude Opus 4.5,并在几乎所有子集上都显著优于Claude Sonnet 4.5。

在办公场景、长程工具调用和综合智能指数上,MiniMax M2.1 相比M2也表现出稳步提升,多项得分打平或超过Claude Sonnet 4.5和Gemini 3 Pro。

其实,发布之初,MiniMax就宣布MiniMax M2.1模型将会开源,过去几天,MiniMax在与多个部署平台对齐测试,并于今天全面开源权重。

用户还可以在MiniMax开放平台和MiniMax Agent上使用这一模型。MiniMax提供了M2.1和M2.1-lightning两个版本的API,这两个API结果完全一样,但是后者速度更快,价格翻倍。

开源地址:

https://huggingface.co/MiniMaxAI/MiniMax-M2.1

https://github.com/MiniMax-AI/MiniMax-M2.1

MiniMax Agent:

https://agent.minimaxi.com/

一、多语言和App开发成重点,打造3D手势交互动画效果惊艳

在编程场景,MiniMax M2.1把多语言和App开发作为重点。

在M2.1中,MiniMax系统性提升了模型在Rust、Java、Golang、C++、Kotlin、Objective-C、Type、Java等编程语言上的能力。这些语言覆盖从底层系统到应用层开发的完整链路。

官方案例中,MiniMax M2.1基于React Three Fiber与InstancedMesh构建了一颗“3D梦幻圣诞树”,成功渲染7000+实例,支持手势交互与复杂粒子动画。可以看到,这颗“圣诞树”能根据用户的手势散开或者聚拢,页面效果流畅。

模型的多语言能力,扩展了模型在更复杂场景的应用。此前,主流模型在编程领域都存在偏科的现象,大部分模型更擅长Web端应用和网页前端的开发,而MiniMax加强了M2.1的Android与iOS开发能力、设计理解与美学表达能力。

下方案例中,M2.1使用Kotlin语言开发了一款安卓原生重力感应模拟器,利用陀螺仪传感器实现重力操控体验,并设计了视觉彩蛋,通过自然的UI过渡与碰撞特效,呈现“MERRY XMAS MiniMax M2.1”信息。

iOS开发中,M2.1打造了一个桌面交互小组件,设计了“沉睡圣诞老人”点击唤醒机制,逻辑完整且具备交互动画效果。

为了理解办公场景的复合指令约束,MiniMax此前已经为其模型引入了交叉思考(Interleaved Thinking)的能力。此次开源的M2.1在系统化问题解决方面的能力再次升级,执行任务时,模型不仅关注代码执行是否正确,同时关注对“复合指令约束”的整合执行能力。

二、模型驱动机器狗行动,还能充当数字员工

MiniMax M2.1还具备较强的Agent能力。MiniMax官方展示了多个案例。

比如,MiniMax M2.1可以直接用于驱动机器狗,理解用户“帮我去后面的吧台那瓶水来”的需求。模型能理解压力传感器变化意味着物品已经被放置,然后转身回去找用户。

Agent能力还体现在模型的工具调用能力上。下方案例中,MiniMax M2.1能自主调用Excel工具和雅虎财经,完成市场调研数据清洗、分析和图表生成任务。

MiniMax M2.1可以用于驱动数字员工。模型能够接受以文字形式展示的网页内容,并以文本形态的输入控制鼠标的点击行为和键盘输入,在日常办公场景下,完成行政、数据科学、财务、人力资源、软件开发类的端到端任务。

比如,模型可以在通讯软件上主动收集员工的设备请求,然后前往企业内部服务器上搜索相关文档获取设备价格,计算总成本并判断部门预算是否充足,然后记录设备变更。

或是在项目管理软件上查找被阻塞或积压的问题,然后在通讯软件上查找相关员工并咨询解决方案,根据员工反馈更新问题的状态。

模型也可以在代码库中查找答案。例如,某同事希望知道改动了某个文件的最近的合并请求是哪一个,检索相关的合并请求,找到编号并告知该同事。

结语:AI编程模型,持续深入生产级场景

随着AI编程的不断渗透,开发者和企业已经不再仅仅满足将编程模型用于简单的代码补全或片段生成。

本周,MiniMax与智谱都发布了主打编程能力的新模型,并强调模型在生产级环境的可用性与处理复杂、复合任务的能力。

未来,模型能否更深入地融入开发工作流、安全稳定地完成端到端任务,将成为影响其价值的重要因素。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...