Kimi第一次有自己的电脑了,分析师、工程师样样精通,一手实测来了!
创始人
2025-09-27 17:21:55
0

智东西

作者 | 陈骏达

编辑 | 云鹏

智东西9月27日报道,近日,月之暗面正在小规模灰度测试Kimi的Agent模式“OK Computer”OK Computer的目标是通过更多轮次推理、更多工具调用、更多token消耗,带来更多智能,月之暗面将其定义为一款“全栈助理”。

在OK Computer模式下,Kimi将拥有自己的虚拟电脑,可以连续工作几十分钟,一步一步自主完成需求调研、规划、分析、设计、开发等环节。

▲OK Computer工作界面,左侧为聊天框,右侧为虚拟电脑(图源:智东西)

与传统依赖人工预设工作流的方式不同,OK Computer背后是月之暗面的原生Agent模型Kimi K2,能应对更多任务场景和突发情况。

借助端到端强化学习技术,Kimi K2掌握了文件系统、浏览器、终端、代码、图片生成、音频生成等20多种工具的使用方式,拥有完成复杂任务所需的内在知识。

官方Demo中,OK Computer能够直接交付功能模块丰富的多页面网站、移动端友好的Web应用以及可编辑的高品质演示文稿等产出物,也能够把几十万行的Excel 数据进行可视化、交互式呈现。

目前,过去两年曾经给予Kimi打赏鼓励的用户,将优先获得OK Computer的体验席位,这部分用户打开网页版Kimi即可收到邀请。

月之暗面称,Agent模式下单个任务的token消耗量可达常规对话模式的几十倍,OK Computer会根据服务器负载情况逐步扩大灰度测试范围。智东西也对OK Computer的表现进行了体验。

一、一手体验海量数据分析能力,把英伟达投资策略捋清了

获得OK Computer模式体验机会的用户,在Kimi首页输入框的左下角能找到OK Computer模式的切换按钮,点击后即可使用。

官方提供了OK Computer模式下的一些模板提示词,如果想体验其能力,又不愿意撰写复杂提示词,可以直接选用这些模板。

智东西从中选择了一项数据可视化任务,要求Kimi从雅虎财经获取英伟达过去两年的股价和财报数据,并分析股价的暴涨是否主要发生在财报发布前后、比较估值(市盈率P/E)与标普500科技板块的平均值。

此外,Kimi还需模拟在每次财报发布前一周买入,发布后一周卖出的交易策略,长期来看是否盈利。

设计风格方面,提示词要求Kimi采用低饱和度的英伟达品牌色,保持布局简洁和谐,仅使用纯色(无渐变),并通过优雅图标提升清晰度。

收到任务后,Kimi会在右侧呈现它在虚拟电脑中进行的各类操作。在开始任务之前,它一般会撰写待办事项,对任务流程进行全面规划,然后再正式执行。

开启OK Computer模式后,Kimi会列出其进行的每一步操作,包括使用数据源、使用文件、使用iPython、使用部署工具等等。分析完成后,它还用简洁的语言给出了关键发现,并将分析图表和结论做成了一个完整的网站,耗时5分钟左右。

生成结果:

https://www.kimi.com/share/19988a15-7962-8c6a-8000-0000857b187e

可以看到,Kimi给出的网页完成度较高,数据可视化清晰,跳转逻辑正确,还提供了JSON格式的分析数据。

智东西核验了页面中部分关键数据的正确性,如英伟达市值、股价等等。在我们的抽查范围内,数据基本无误,不过英伟达的市盈率与雅虎财经上显示的数据有出入。

这一任务考察的能力类型众多,OK Computer模式下的Kimi需要从指定来源抓取正确数据和对应时间,理解提示词中谈到的各种金融术语,还需要利用Python进行数据分析,并将结果按照风格要求可视化。如果是人工完成,可能需要耗费数小时。

我们将官方提示词中的企业从英伟达改为AMD,切换了比较的基准,Kimi同样能给出类似质量的分析结果,这在某种程度上也印证了其能力不是完全靠“背题”实现的。

生成结果:

https://www.kimi.com/share/19988bb0-9b82-864d-8000-0000e74d03a4

不过,OK Computer并不是市面上唯一一款具备类似能力的Agent,我们也将这一任务交给了Manus。

可以看到,Manus的执行风格更偏向直接上手做,收到任务后直接就开始查询财经数据的API了。Manus最终交付了一份MarkDown文档,以及四张数据图表。

Manus的报告内容更为宏观,在具体数据的呈现上比OK Computer更少,报告长度也更短,任务耗时比OK Computer长。数据可视化方面,其图表的美观程度和OK Computer相比还有一定差距。

二、擅长PPT、多功能网站开发,多位网友给出好评

月之暗面介绍,OK Computer已掌握的工具集包括列待办事项、写Python代码、操作终端、浏览网页、文字搜索、图片搜索、图片生成、音频生成、接入专业财经数据源、网站部署等。

在该公司的内部测试中,OK Computer目前擅长的任务类型,包括多功能网站原型开发、海量数据分析与可视化、高品质演示PPT制作等。

x平台上的一名科技博主分享,他用OK Computer打造了一个功能完备的星座网站。这个网站可以帮助用户了解每个星座的特征,还可以比较两个星座之间是否匹配。其设计风格也与网站的主题较为匹配。

▲OK Computer生成的星座网站(图源:Gadgetify)

还有网友分享,自己用OK Computer打造了一个文档比较网站,可以看到这一网站设计简洁美观,这位网友反馈完成率还不错。

官方Demo中,借助OK Computer,Kimi还打造了一份对电影《2001太空漫游》视觉元素的深度解析PPT,要求仅使用电影原图与影视和学术深度解析文章。

Kimi会先设定计划,搜索电影原图素材和关键场景的图片,搜索电影深度解释和学术研究资料,经过深度研究和素材资料收集,然后才开始按照视觉规范制作PPT。

最终,Kimi可以交付一份演示文稿,既可以在线分享,也可以下载到本地。

结语:从问答机器到全栈开发,大模型竞逐Agent能力

月之暗面称,未来他们会为OK Computer模式带来更丰富的工具选项和自定义工具能力,也支持连接更多外部应用,让Kimi可以完成更多类型的任务。

这也顺应了行业内的一大趋势:通用大模型正从知识问答阶段、生产力工具阶段迈向通用Agent阶段。未来,谁能率先在工具生态整合、长时任务执行、可靠性和合规性上建立优势,谁就可能在新一轮竞争中占据先机。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...