罗福莉：龙虾成本黑洞显现，需要更高token效率的Agent框架_科技动态

罗福莉：龙虾成本黑洞显现，需要更高token效率的Agent框架

创始人

2026-04-06 16:12:47

0次

但罗福莉认为，这种压力恰恰是倒逼工程质量改善的催化剂——只有让效率低下的成本真实可见，才能推动开发者认真对待上下文管理与缓存优化。

订阅制度背后的成本黑洞

罗福莉指出，Claude Code的订阅体系在算力分配设计上颇为精巧，但她坦言，这套系统大概率无法盈利，甚至可能处于亏损状态。

问题的根源在于第三方框架的调用方式。以OpenClaw为例，其上下文管理存在明显缺陷：在处理单个用户请求时，系统会拆分出多轮低价值工具调用，以独立API请求的形式逐一发出，每次请求携带的上下文窗口往往超过10万个token。

即便存在缓存命中，这种模式也极为浪费；在极端情况下，还会拉高其他请求的缓存未命中率。

罗福莉估算，这类框架每个查询实际产生的请求数，往往是Claude Code原生框架的数倍。换算成API计费，实际成本可能是订阅价格的数十倍。她将这一差距称为"不是缺口，而是天坑"。

AI工作坊组织者@newlinedotco评论称：订阅的“all you can eat”套餐从一开始就是定时炸弹——第三方harness（如OpenClaw）24/7循环调用，API成本可能高达5000美元，而订阅仅200美元。官方工具（如Claude Code）因优化prompt cache才可持续。

封堵之后：短痛与长期规律

Anthropic此次调整并未完全关闭第三方接入的大门。OpenClaw、OpenCode等工具仍可通过API调用Claude，只是失去了搭乘订阅计划的通道。

这一区别至关重要。对于习惯以订阅价格使用这些工具的用户而言，成本冲击是即时且显著的。

但罗福莉认为，这种痛感具有修正意义——它会迫使框架开发者认真提升上下文管理能力，最大化提示缓存命中率以复用已处理的上下文，并削减无效token消耗。她将这一过程描述为"痛苦最终转化为工程规律"。

她同时提醒各大语言模型公司，在尚未厘清编程计划成本结构之前，不应盲目卷入定价竞底。廉价出售token同时对第三方框架敞开大门，表面上对用户友好，实则是一个陷阱——而Anthropic刚刚走出了这个陷阱。

她进一步指出，若用户在低质量框架、不稳定推理服务和降级模型上消耗大量精力后仍无所获，对用户体验和留存都将造成实质损害。

对此，AI 工程师 @karpathy指出:

“伟大的软件往往诞生于限制之中。如果 Token 是免费的，没人会去写精简的 Prompt 或研究 Context 压缩；当成本变成瓶颈，开发者才会真正思考如何构建‘有脑子’的 Agent。”

MiMo Token计划的不同路径

在解读Anthropic举措的同时，罗福莉也阐明了MiMo Token计划的设计逻辑。

该计划支持第三方调用框架，采用按token配额计费的方式，逻辑上与Claude新近推出的超额用量包一致。

罗福莉强调，MiMo的目标是"长期稳定地交付高质量模型和服务，而非让用户冲动付费后流失"。

这一表述折射出一种与订阅制度不同的算力分配哲学：通过真实的用量成本约束用户和框架的行为，而非以封闭方式管理滥用风险。

效率竞争，而非算力消耗

上一篇：原创人类灭绝大局已定？科学家算出人类灭绝日期，我们能侥幸存活吗？

下一篇：联虹技术申请数据处理方法专利，提升数据包处理效率

罗福莉：龙虾成本黑洞显现，需要更高token效率的Agent框架

相关内容

热门资讯