但罗福莉认为,这种压力恰恰是倒逼工程质量改善的催化剂——只有让效率低下的成本真实可见,才能推动开发者认真对待上下文管理与缓存优化。
订阅制度背后的成本黑洞
罗福莉指出,Claude Code的订阅体系在算力分配设计上颇为精巧,但她坦言,这套系统大概率无法盈利,甚至可能处于亏损状态。
问题的根源在于第三方框架的调用方式。以OpenClaw为例,其上下文管理存在明显缺陷:在处理单个用户请求时,系统会拆分出多轮低价值工具调用,以独立API请求的形式逐一发出,每次请求携带的上下文窗口往往超过10万个token。
即便存在缓存命中,这种模式也极为浪费;在极端情况下,还会拉高其他请求的缓存未命中率。
罗福莉估算,这类框架每个查询实际产生的请求数,往往是Claude Code原生框架的数倍。换算成API计费,实际成本可能是订阅价格的数十倍。她将这一差距称为"不是缺口,而是天坑"。
AI工作坊组织者@newlinedotco评论称:订阅的“all you can eat”套餐从一开始就是定时炸弹——第三方harness(如OpenClaw)24/7循环调用,API成本可能高达5000美元,而订阅仅200美元。官方工具(如Claude Code)因优化prompt cache才可持续。
封堵之后:短痛与长期规律
Anthropic此次调整并未完全关闭第三方接入的大门。OpenClaw、OpenCode等工具仍可通过API调用Claude,只是失去了搭乘订阅计划的通道。
这一区别至关重要。对于习惯以订阅价格使用这些工具的用户而言,成本冲击是即时且显著的。
但罗福莉认为,这种痛感具有修正意义——它会迫使框架开发者认真提升上下文管理能力,最大化提示缓存命中率以复用已处理的上下文,并削减无效token消耗。她将这一过程描述为"痛苦最终转化为工程规律"。
她同时提醒各大语言模型公司,在尚未厘清编程计划成本结构之前,不应盲目卷入定价竞底。廉价出售token同时对第三方框架敞开大门,表面上对用户友好,实则是一个陷阱——而Anthropic刚刚走出了这个陷阱。
她进一步指出,若用户在低质量框架、不稳定推理服务和降级模型上消耗大量精力后仍无所获,对用户体验和留存都将造成实质损害。
对此,AI 工程师 @karpathy指出:
MiMo Token计划的不同路径“伟大的软件往往诞生于限制之中。如果 Token 是免费的,没人会去写精简的 Prompt 或研究 Context 压缩;当成本变成瓶颈,开发者才会真正思考如何构建‘有脑子’的 Agent。”
在解读Anthropic举措的同时,罗福莉也阐明了MiMo Token计划的设计逻辑。
该计划支持第三方调用框架,采用按token配额计费的方式,逻辑上与Claude新近推出的超额用量包一致。
罗福莉强调,MiMo的目标是"长期稳定地交付高质量模型和服务,而非让用户冲动付费后流失"。
这一表述折射出一种与订阅制度不同的算力分配哲学:通过真实的用量成本约束用户和框架的行为,而非以封闭方式管理滥用风险。
效率竞争,而非算力消耗