世界上许多最重要的系统——负责资金流转、机票预订、许可证发放和理赔处理的系统——都运行缓慢、脆弱且严重过时。这些系统建于数十年前,经过反复扩展,现在处于工作流程的核心位置,太过重要以至于无法暂停、下线、重建或替换。
在亚马逊的通用人工智能实验室内,团队训练智能体不是在理想化的界面上,而是在这些遗留系统的高保真仿真环境中。学习这些系统的真实行为——怪癖、延迟、错误状态和隐形依赖关系——使一种不同的创新成为可能,这种创新从我们现有的系统中成长,而不需要替换它们。通过在幕后管理遗留系统的特殊性,智能体有效地成为了一个通用API——客户可以用来执行各种专用任务的单一界面。
隐藏的人工劳动层
走进任何大型机构——银行、保险公司、医院、政府机构——的幕后,你会发现同样的情况:一个看不见的人工劳动层将软件维系在一起。人们知道必须按什么顺序点击哪些按钮,哪些警告可以忽略,哪些字段必须输入两次,哪些屏幕绝对不能刷新。导航这些特殊性所需的机构知识像遗留系统的口述传统一样传承下来。
支撑这些工作流程的大部分基础设施比管理它的人还要古老。现代金融、保险、旅行、科学研究和公共服务的软件骨干形成于20世纪60年代和70年代,建立在大型机架构上,用COBOL和FORTRAN等语言编写——为稳定性而非适应性而设计。
当互联网时代到来时,机构没有重建,而是进行了包装。Web表单输入大型机作业,中间件将现代输入转换为数十年前的格式,企业门户在从未重写的业务规则之上积累。随着时间的推移,现代化沉淀成了层次:底层是大型机指令集;其上是90年代的数据库;再上层是2000年代的门户;现代网络界面掩盖着下面的一切。今天的单个交易可能要通过所有这些层——脚本、连接器和集成以没人完全理解的方式将它们维系在一起。
替换这些系统的尝试经常搁浅。出现了没人知道存在的依赖关系,迁移失败,预算失控,公共部门现代化努力在自身复杂性下崩溃。这些系统无法下线,这意味着机构必须继续运行它们,无论它们变得多么脆弱。对于亚马逊来说,这是智能体AI最有说服力的应用之一——不是导航网络时代消费应用的精美界面,而是导航保持机构运转的深层、缓慢移动的架构。
学习不良行为以治愈不良系统
训练AI智能体最困难的部分不是教它成功的工作流程是什么样的;而是教它为什么工作流程会失败。遗留系统背后的逻辑通过摩擦最清楚地显现出来:延迟出现的模态窗口编码了一个排序规则;在另一个值保存之前拒绝输入的字段;因为后台作业中途重启而重置的表单。这些行为不是故障,它们是系统的真实语义。
亚马逊AGI实验室的研究人员主动寻找这种摩擦。为了安全且重复地暴露失败模式,亚马逊在强化学习环境中训练智能体——这些合成环境旨在重现嵌入在真实工作流程中的怪癖、延迟和排序规则。这些包括模拟政府机构、航空预订和专门的税收和福利处理等数百种其他系统的合成网络环境。
Jason Laster是一名AGI软件工程师,从事智能体训练和重播系统工作,他直言不讳地说:"我希望推动我们的强化学习训练环境具有所有的缺陷和所有的问题。"
这就是"学习不良行为以治愈不良系统"的含义:在系统真实行为的全谱上训练智能体,包括缺陷、不一致、延迟以及人类已经悄悄适应的所有嵌入式历史。通过让智能体接触人们每天导航的同样的破损,亚马逊训练它们超越表面正确性,理解界面下更深层的逻辑。
智能体作为合成API
一旦智能体能够可靠地导航遗留界面的特殊性,就会开始发生更有趣的事情。研究人员观察到智能体不仅推断出下一步要点击什么,而且推断出原因——界面表达的潜在工作流程。在一个模拟福利申请环境中,一个意识到只添加了一个受抚养人的智能体能够导航回去,纠正遗漏,并恢复流程而不重新开始——这是理解系统本质的早期迹象。
对于实验室成员来说,这标志着一个架构转折点。许多机构系统根本不暴露反映真实工作流程行为的API;逻辑的唯一忠实表达就是界面本身。正如Laster所说,"UI被设计为可发现、可学习的——即使它很糟糕。"当智能体足够深入地学习那一层以预测结果和从失败中恢复时,它们开始作为一种合成API发挥作用——在无法更改的基础设施上的稳定、可编程界面。这种转变启用了新的架构可能性:
在不稳定UI上的稳定语义:智能体将不一致的行为——延迟、重新渲染、部分保存——转换为可预测的模式。
跨系统抽象:由于智能体推理工作流程而非应用程序,它可以桥接从未设计为互操作的系统。
增量现代化:机构可以逐步更新组件而不破坏工作流程;智能体吸收过渡期的脆弱性。
保存机构逻辑:智能体保留了原本只存储在人类记忆中的操作知识——没人记录过的规则、序列、依赖关系。
这不是工作流程自动化,这是世界上最古老系统的新界面层——一条不需要关闭任何东西的升级路径。
未来的工作
智能体AI不会替换构成日常生活的管理任务——预订假期、更新许可证、安排医疗预约——但它可以通过允许一度过于脆弱而无法改变的系统进化来帮助提高效率。
这种脆弱性正在变得更加尖锐。构建20世纪60年代和70年代机构骨干的程序员——COBOL批处理作业、FORTRAN例程、大型机集成——正在退休。很少有年轻开发者学习这些语言,嵌入在这些系统中的知识每年都变得更难获取。关键工作流程现在运行在越来越少的人理解其内部工作原理的软件之上。
智能体提供了一种不同形式的连续性。通过学习这些系统的行为方式——不是从丢失的文档中,而是从系统本身——它们可以保存否则会消失的操作逻辑。它们可以稳定坐落在没人能安全重写的代码之上的工作流程,并传承否则会随着劳动力老化而消失的机构知识。
从这个意义上说,"未来的工作"是双重的。有构建能够满足这些环境所需可靠性的智能体的技术工作。还有当人们不再被困在脆弱界面内时变得新可能的人类工作——基于判断、协调、共情和设计而非记住哪个字段必须输入两次的工作。
智能体不会重建我们数字世界的基础。但它们可能重建其他东西:我们关于创新只来自替换的观念。通过将脆弱系统转变为稳定平台,智能体提供了一种新的进步模式——从已经有效的东西中成长的模式。
Q&A
Q1:亚马逊AGI实验室如何训练智能体处理遗留系统?
A:亚马逊在强化学习环境中训练智能体,这些合成环境专门设计来重现真实工作流程中的怪癖、延迟和排序规则。包括模拟政府机构、航空预订、税收和福利处理等数百种系统,让智能体学习系统的真实行为包括所有缺陷和问题。
Q2:智能体AI如何成为遗留系统的通用API?
A:当智能体深入学习遗留界面并能预测结果、从失败中恢复时,它们就成为合成API——在无法更改的基础设施上提供稳定、可编程的界面。它们将不一致行为转为可预测模式,桥接不同系统,实现增量现代化。
Q3:为什么现有的重要系统无法被替换?
A:这些系统建于几十年前,现在处于工作流程核心,太重要无法暂停或下线。替换尝试经常因未知依赖关系、迁移失败、预算超支而搁浅。加上支撑它们的程序员正在退休,相关知识越来越稀缺,使得维护比替换更现实。