今天分享的是:2025年中国联通面向无状态计算服务的算力网络白皮书
报告共计:42页
中国联通发布算力网络新方案,AI时代无状态计算服务迎来调度革命
在数字经济与AI技术双轮驱动下,算力已成为像水、电一样的关键基础设施。随着大模型推理、智能体交互等无状态计算服务兴起,传统算力网络面临“资源调度与应用需求割裂”“网络协议与服务接口错位”等难题。近日,中国联通联合多家科研机构与企业发布《面向无状态计算服务的算力网络白皮书》,提出一套全新算力网络解决方案,为AI时代算力高效流动提供新路径。
当前,算力服务形态正发生深刻变革。从云计算、云存储到模型即服务(MaaS),不同业务对算力网络的需求差异显著。比如,云计算服务的算力任务生命周期可能长达数月,依赖L2/L3层网络连接;而大模型API调用这类无状态计算服务,单次任务仅需毫秒级,更需要应用层协议支撑。传统算力网络多聚焦资源层调度,用户若想使用某类AI模型服务,需自行在分配的算力资源上部署模型、维护接口,不仅增加操作难度,还难以实现全局最优调度。
针对这些痛点,中国联通提出的新型算力网络方案,核心是将无状态计算服务的“服务化范式”深度融入网络架构。方案摒弃了传统以IP地址为核心的标识方式,创新性地采用URL-PATH作为算力标识——通过类似“/ai/deepseek/v1”的层级路径,直接携带服务类型、版本等语义信息,无需依赖外部系统就能实现精准寻址。这种设计既兼容现有HTTP协议生态,又能让网络设备直接解析算力需求,为细粒度调度奠定基础。
在组网架构上,方案以传统物理网络为底层支撑,通过部署Overlay网络实现跨域算力互联。位于网络边界的算力服务网关成为关键枢纽,不仅能解析用户的HTTP请求、识别URL-PATH中的算力标识,还能动态构建适配业务需求的“网络弹性管道”。例如,对于图像识别这类对带宽要求高的服务,网关会自动匹配高带宽QoS流;而语音合成服务则优先分配低时延传输通道。这种“按需匹配”的能力,让算力服务与网络资源实现深度协同。
该方案的技术创新点集中在多个维度。在路由机制上,突破传统IP路由“只认位置不认服务”的局限,构建服务语义路由表,结合算力实例负载、网络状态等动态选择最优节点;在身份安全方面,引入分布式身份技术(DID),为每个算力服务实例生成唯一数字凭证,既解决跨域信任问题,又能实现API级别的细粒度权限管控;在算力度量上,建立涵盖计算(如FLOPS)、网络(如时延抖动)、服务(如实例存活时长)的多维度指标体系,为调度决策提供精准数据支撑。
从应用场景来看,这套方案已展现出广泛适配性。在智能体领域,通过语义化路由,智能体可直接调用全局范围内的最优算力资源,无需受限于本地部署,开发者只需关注功能逻辑,无需操心资源调度;在多云算力服务中,将服务入口下沉至边缘网络,结合实时算力与网络状态动态分配请求,解决传统DNS调度粒度粗、QoS保障弱的问题;在跨域大模型推理场景中,全局控制器实时采集各数据中心负载,不仅能实现负载均衡,还能自动识别隐私请求并引导至边缘节点处理,兼顾效率与安全。
当然,方案落地仍面临挑战。API细粒度调度导致全网状态同步复杂度激增,需要分层分域管理降低压力;URL-PATH标识的标准化的推进,还需行业各方共同参与;应用层协议解析对网关性能要求较高,未来需通过硬件加速、边缘部署等方式优化时延。
展望未来,随着“东数西算”工程深入推进,算力网络将朝着泛在化、服务化、生态化、融合化方向演进。到2035年,算力网络有望从“信息高速公路”升级为“智能社会操作系统”,实现计算、网络、模型、业务的深度融合。中国联通此次发布的方案,不仅为无状态计算服务提供了高效调度方案,也为我国算力基础设施建设提供了技术参考,将助力数字经济向更高质量发展。
以下为报告节选内容
报告共计: 42页
中小未来圈,你需要的资料,我这里都有!