编辑 | 云昭
鲨疯了!这两天,又有一款让人直呼“Jarvis”产品,横扫硅谷AI圈。
近日,X上、YouTube上涌入了数不过来的一款名为“Clawdbot”的产品截图。
“一晚上帮用户处理 1 万封邮件”、“躺床上把网站全迁了”、“自动监控市场机会”
注意,这次可不是Demo。
甚至手快的网友,赶紧火速出了安装速成指南。
“一款比ChatGPT更好用的AI助手”
“Clawdbot 就是十年前我们被承诺的人工智能助手。”
不少网友对这款开源的产品感到兴奋,并认为它才是真正的AI助手的样子。
与 ChatGPT、Claude 不同,这款被疯狂传播的开源产品,有着鲜明的“本地私人助理”属性,在“执行任务”方面表现让人深刻。
官网上这样介绍:
Clawdbot 是一个运行在你自己设备上的个人 AI 助手。它会在你已经使用的通信渠道里与你对话,包括 WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat,以及一些扩展渠道,如 BlueBubbles、Matrix、Zalo 和 Zalo Personal。
它可以在 macOS / iOS / Android 上进行语音对话(能说、能听),还可以渲染一个由你控制的实时 Canvas。Gateway 只是控制平面,真正的产品是这个助手本身。
如果你想要一个单人使用的个人助理,体验上接近本地、响应快、始终在线,那就是它。
至于具体使用用例上,就是文章开头所提到的,自动化帮你搞定很多繁杂琐碎事务的Agent。
比如:
晨间简报醒:来即可收到一份概要:重要邮件、当日日程、待办事项。起床前即可发送到您的手机。
健康追踪功能:“连接我的 WHOOP 账户,即可获得每日健康概览。” 设置仅需 5 分钟。现在,他们可以自动获取健身数据。
研究助理:“帮我找到XX酒店附近 5 家最好的餐厅。”它会搜索、比较并提供选项——所有操作都在文本对话中完成。
任务自动化:“每周五下午 5 点,给我发送一份本周工作总结。” 设置一次,永久运行。
Wild Stuff 的一位用户让 Clawdbot 编写定制冥想内容,利用 AI 语音生成音频,添加环境音乐,并每天早上推送。全程自动化。
还有就是一晚上重构了一整个个人网站。
关键是,速度很快!(2 小时的事情可以 5 分钟实现。)
众所周知,现在的ChatGPT等形态的ChatBot,虽然很聪明,但在实际干活方面还需要用户自己去执行交付。
但这次的 Clawdbot 真正有了 “Jarvis” 的样子:
你在 Telegram 上给它发消息,它就能控制你的 Mac、帮你做研究、每天早上给你发简报、记住所有事情。
大家提“Agentic AI”已经有一段时间了,Clawdbot 可以说当之无愧!
这款产品,究竟有哪些不同?
一位博主在深度使用了40个小时后,总结了这款产品的四个特性。
1. 首先,它运行在本地计算设备上,而不是在云端。这也就意味着,Clawdbot可以访问文件、应用程序和数据。
2. 用户,你可以随时随地控制它:用手机上的 WhatsApp,用 iPad 上的 Telegram,用手表上的 iMessage。你无需依赖浏览器。
3. 它可以使用你电脑上的任何应用程序,例如电子邮件客户端、浏览器、终端和脚本。如果你能手动完成的事情,Clawdbot 理论上都可以自动完成。
4. 它可以构建自己的工具。这才是最神奇的地方。你可以让它创建一个“skill”(一个可重用的工作流程),在适当的指导下,它可以编写代码、安装并开始使用它。
一个例子就是:一位网友问 Clawdbot:“你能查看我的大学课程表吗?”
Clawdbot 回复道:“不,但我可以开发一个skill来实现这一点。请给我一分钟时间。”
经过多次迭代和改进,它最终实现了集成。此外,还有一位网友实现了Sora API的集成。
简单来看,其实就是一个“端侧AI”的形态:
它存在于你的即时通讯应用中;它会记住所有信息;它会主动给你发消息;它还能执行实际任务。
更让人省心的是,不需要像很昂贵的算力就可以运行它。5 美元服务器,一条安装命令,就可以搞定。
工作原理简单:Gateway是控制中枢
Clawdbot 的核心架构非常简单:
来自各种平台的消息 → 经过一个本地 Gateway → 在你的电脑上执行任务
具体流程是这样:
用户可以通过 WhatsApp、Telegram、Discord 或 iMessage 发消息。
然后,消息会进入一个运行在用户电脑上的 Gateway(它相当于控制中枢)。
Gateway 会负责:
把请求发给 Claude(通过 Anthropic API)
在你的电脑上执行命令
管理和消息应用的连接
处理文件操作和自动化流程
用户则可以通过这些方式和它交互:
消息应用(最常见)
CLI(命令行)
macOS / iOS / Android 原生应用
浏览器里的 Chat UI
注意,所有东西都跑在用户的本地机器上,包括用户的数据,也是保存在当地设备上的。而 Gateway 则是连接用户和设备的桥梁,替用户“发号施令”控制设备执行任务。
Clawdbot是新的炒作吗?
很快,这款产品的Github星数疯狂飙涨了起来,直逼25k!
而这款产品出道,也不过一个多月的时间。
不过,这波一堆社交媒体的疯狂传播的场面似曾相识。
相较于X上的狂热,Reddit上的网友反而显得异常理性。
一位网友点出了许多人的顾虑:这明显是营销造势,用令人瞩目的用户增长在为种子轮融资中支撑起10亿美刀的估值而已。
不得不说,AI圈的朋友们眼睛一贯是雪亮的。比如一位Reddit用户发帖表示:
Clawdbot 所展示的功能在技术上并不难实现——我们已经可以让 LLM 完成它的大部分功能。真正的挑战始终在于实施适当的安全程序和防护措施,而不是核心功能本身。
“据我所知,Clawdbot 基本上是在消耗大量的 LLM Token 来完成某些任务,而不太关心安全协议。”
“这……算不上什么突破性创新吧?”
他点评到:Clawdbot 更多的意义在于:让市场看见了一种新形态的可能,即,当用户移除安全护栏并冲了会员费之后,AI产品会发生什么。
对此,X上一位连续创业者,同样表示了安全方面的风险。Rahul 表示,不要草率使用这款产品。
当然,这款产品的开发者也好不遮掩,并表示“没有任何护栏限制,这是有意为之。”他们的目标用户是追求极致性能、愿意接受相应取舍的高级用户。
Rahul 为此还基于自身测试经验,提供实用安全建议,包括使用专用机器、新账户、焚毁手机号、独立密码管理器,并避免授予后端密钥访问权限等等。
网友警告:并不能安装后就可以“自动化一切”!
即便目标用户可以忍受“自己的设备处于全裸”状态,但仍然还有使用层面上的“体验幻觉”。
X上一位昵称为“shruti”的网友表示:
先把幻觉戳破: Clawdbot 并不是装完就能“自动化一切”。这是现在最大的信息污染。
但几乎没有一个是“装完立刻做到”的。
shruti,表示 Clawdbot 有两个完全不同的能力层级。如果你不分清楚,体验一定会崩。
第一层能力:普通人现在就能用的部分。这一层,是真的友好。比如:文件管理(整理文件夹,按类型日期归档、查找历史文件),再比如信息抓取总结,还有日程读取和邮件读取(需要一次性授权)等等,这些一句话就能跑,几乎不需要额外配置。本质是:AI + 浏览器 + 文件系统,一起干活。但,第二层能力上,就是一些自媒体吹得有点过、也最容易翻车的部分。shruti 表示,比如邮件“智能自动化处理”的例子,能不能做?能。但前提是:
你知道怎么分类、你能把规则讲清楚、你愿意花时间调。否则就是一场灾难。
再比如“ 交易监控”,想要实现自动化,同样需要不少的功夫。
数据源从哪里来?API 鉴权问题?监控逻辑是怎样的?
这些都是需要提前做充足的准备。总之——
Clawdbot 不会替你想清楚“你到底要什么”,它只会在你想清楚之后,替你把事情做完。
写在最后:一款值得关注的Agentic产品
“Agentic AI”的概念,从去年开始,就已经被圈内看好。
只不过,如何让能力强大的 AI,去无缝地、主动地为用户提供帮助,还处于一个非共识阶段。
我们看到OpenAI的“browser use”的 Operator,已经 Claud Code 结合MCP 技术的“多步骤授权”的 Agent,也看到类似“豆包手机”的端侧智能的惊艳亮相。
这些都是业内可圈可点的 AI Native 产品的不错尝试。
而 Clawdbot 无疑也属于此列。这种大胆的“放开权限,让AI肆意融入用户平时使用的各种通信App的做法,或许将慢慢在市场中兴起,并快速迭代出平衡稳定的产品形态。
整体来说,还是给业界带来了不小的新想象空间。就比如不少网友在评论区的调侃:
以后,自己的生产力将会用“坐在马桶上或洗澡时候思考的时间”来衡量。
参考链接:
https://github.com/clawdbot/clawdbot