耗资460万美元赶超GPT5？Kimi团队回应一切_科技动态

耗资460万美元赶超GPT5？Kimi团队回应一切

创始人

2025-11-11 21:20:32

0次

上周，Kimi K2 Thinking 发布后，凭借其在智能体、代码和写作能力上的显著进步，引发了广泛关注。11 月 11 日，Kimi 团队在 Reddit 上举办了一场 AMA 活动，创始人杨植麟也参与其中，透露了诸多信息。

关于下一代模型 K3 的发布时间，Kimi 团队幽默地表示，这取决于奥特曼的万亿美元数据中心何时建成。这一回答既体现了幽默，也暗示了 Kimi 在资源利用上的独特方式。团队还透露，K3 将继续沿用当前效果显著的 KDA 注意力机制。此外，Kimi 团队强调，他们专注于模型训练，能力的体现将通过大模型助手来完成，而非像 OpenAI 那样发布 AI 浏览器。

在训练成本方面，Kimi 澄清了 460 万美元的传闻并不准确，指出大部分资金用于研究和实验，难以具体量化。硬件方面，Kimi 使用的是 H800 GPU 和 Infiniband，虽然不如美国顶级 GPU，但团队充分利用了每一张卡。

Kimi K2 Instruct 的风格被用户称赞为“比较少的谄媚，有洞察力且独特”，这得益于“预训练 + 后训练”的方式。然而，也有用户指出 Kimi K2 Thinking 的写作风格过于积极正面，AI 味过重。对此，Kimi 团队承认这是大语言模型的常见问题，并表示现阶段的强化学习会刻意放大这种风格。

在技术方面，Kimi 在 AMA 中分享了 KDA 注意力机制的细节，这种机制在长序列强化学习场景中展现了性能提升，未来可能会应用于 K3。此外，Kimi K2 Thinking 的超长推理链得益于训练方式和 INT4 量化训练技术，这使得推理速度提升且逻辑不会因压缩量化而崩溃。

关于视觉语言能力，Kimi 表示目前正在完成这项工作，但由于数据获取和训练需要大量时间，团队优先选择了纯文本模型。对于开发者关心的成本问题，Kimi 解释了 API 定价方式，并表示会考虑更好的计算方法。团队还强调了开源的重要性，认为通用人工智能应是团结而非分裂的追求。

上一篇：全球AI领袖齐聚首尔聚焦自主智能体与产业化应用

下一篇：原创四川天府新区智能建造产业联盟成立现场签约超4亿元

耗资460万美元赶超GPT5？Kimi团队回应一切

相关内容

热门资讯