智谱AutoGLM上线:给每个手机都装上通用Agent
创始人
2025-08-20 21:23:18
0

还记得「AI 给人类发的第一个红包」吗?

去年10月智谱发布全球首个Phone-Use产品AutoGLM,开启Agent的新时代。

今天,AutoGLM 2.0再次升级,将Agent应用提升到新的高度——

  • 全球首个手机Agent,人人可用;

  • 开创Agent+云手机/云电脑的新技术范式,不抢占用户手机和电脑;

  • 突破硬件限制,在任何设备、任何场景下运行,帮助用户代理操作;

  • 国产模型(GLM-4.5、GLM-4.5V)驱动,具备推理、代码与多模态的全能能力。

即刻起,人人都可使用AutoGLM。我们将快速迭代推出新功能(“定时任务”很快上线,AI每天主动替你干活)。应用商店搜索“AutoGLM”,或点击文末“阅读原文”。

操作执行助手

过去的AI多停留在“对话”层面;一般的智能体助手也多局限于信息查询和总结。

AutoGLM 2.0 则实现了质的飞跃——它不再只是“说”,而是真正能够“做”。

事实上,在AutoGLM 1.0中,我们已探索过让AI代替用户完成部分手机操作,但只在有限场景下生效。随着AutoGLM 2.0的发布,它已经成长为一名执行型助手,能够在「云端」自主完成多样化的任务。

在生活场景中,用户只需一句话,就能让 AutoGLM 操作美团、京东、小红书、抖音等几十个高频应用:点外卖、订机票、查房源,例如帮你买「秋天的第一杯奶茶」。

在办公场景中,它同样能跨网站执行全流程工作,操作网页版的飞书、网易邮箱、知乎、微博、抖音、微头条等网站:从信息检索到内容撰写,再到生成视频、PPT 或播客,并直接完成小红书、抖音等社交媒体平台内容发布。

这意味着,AI不再是一个“聊天工具”,而是一个能真正替你干活的全能代理人。不仅能给出答案,还能把任务完整执行,帮助用户节省时间与精力,彻底改变人与AI的协作方式。

为AI配一台手机

AutoGLM的主要亮点,是一个APP让一部手机成为真正的“新物种”。

在AutoGLM 2.0中,我们为AI配备了专属智能体手机/智能体电脑,让它可以在云端自主干活、完成任务,而无需占用用户的本地设备,期间用户可以使用其他 APP(如刷抖音、打游戏)。

这意味着AI不仅能“自动驾驶手机”,还可“异步代理办公”。让手机变成具备自主执行、跨端协作能力的智能体手机。

AutoGLM会以这样的产品形态出现,源于我们对AGI早期形态的理解。我们认为从Agent到AGI,还需要满足3A原则:

  • Around-the-clock(全时):24 小时运行,即使用户离线,Agent 依然在执行任务;
  • Autonomy without interference(自主零干扰):独立运行,不占用用户屏幕与算力,平行世界的搭子;
  • Affinity(全域连接):跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界。
AI新硬件

借助AutoGLM强大的云端执行能力,人与设备的交互方式正在被重新定义。

我们已将AutoGLM的操作执行能力封装为API,开发者只需简单接入,即可将这一能力无缝融入各类硬件设备,从AI眼镜等可穿戴设备到传统家电。

AutoGLM首次让硬件具备完整的手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。例如,可以通过智能眼镜点一杯咖啡。

今日起,AutoGLM移动端API申请通道及开发者生态共建计划正式上线。除手机与电脑外,手表、眼镜、家电等设备都能成为Agent驱动的智能助手。

期待与更多开发者共同探索AI融入物理世界的无限可能。

技术SOTA

AutoGLM可以在国内免费向所有人开放,因为它是纯国产Agent,成本相较于接入国外模型的Agent有了数量级的下降。

AutoGLM由智谱最新开源SOTA语言模型GLM-4.5与视觉推理模型GLM-4.5V驱动。AutoGLM将基座模型原生能力发挥到极致,并结合在「端到端异步强化学习」方面的多项突破成果,可以完成推理、编码、研究、Agentic与GUI操作等多类任务,并可根据需求灵活调用最合适的「大脑」完成执行。

  • ComputerRL:提出API-GUI协同范式,提升数据多样性与计算效率;改进GRPO并提出 Entropulse 机制,增强探索与策略多样性。
  • MobileRL:创新难度自适应强化学习方法(推理自举预热 + 难度自适应GRPO),显著提升移动端任务的稳定性与收敛效率。
  • AgentRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定与梯度分布不均,增强整体鲁棒性与效率。

在Device Use基准测试(涵盖手机、电脑和网页操作)中,AutoGLM表现优于ChatGPT Agent、UI-TARS-1.5和Claude Sonnet4,展现出更强的鲁棒性与通用性,处于主流Agent的SOTA水平。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...