中国工商银行山东省分行:多地多园区云计算生态
创始人
2025-08-25 18:23:00
0

来源:鑫智奖·2025第六届金融机构数智化转型优秀案例评选

获奖单位:中国工商银行山东省分行

荣获奖项:基础设施优秀案例奖

一、项目背景及目标

在当今数智化时代,信息技术深刻地影响着银行的运营模式与市场格局。随着AI智能体、云计算、大数据等新兴技术的广泛应用,客户需求日益多样化、个性化,市场竞争愈发激烈。在此背景下,云计算生态作为银行数智化转型的基石,其重要性不言而喻。采用云原生架构、微服务架构能够将大型业务系统拆解为众多微小的服务模块,如同积木一般可根据市场需求快速组合、调整业务功能,各团队可并行推进业务创新,实现产品与服务的快速创新。基于此,山东工行着手打造全栈自主可控的分布式高可用云计算生态。

二、创新点

山东工行多地多园区云计算生态创新点有如下四个方面:

一是多园区多活架构。山东工行基于总行数据中心上海园区、北京园区和本地主机房、本地同城机房,形成多地多园区云计算技术架构。依托智能DNS,建成多园区高可用智能接入网关,基于域名智能解析提升分行应用多园区接入能力;计算资源方面,运用数字化资源管理手段,合理分布各园区资源配额,动态扩展云计算资源池。

二是丰富的云生态组件。山东工行基于容器化技术,将应用制作成轻量级、可移植的镜像,依托PaaS实现容器编排、自动部署、扩展、监控与自愈;建设了一批包括软负载均衡、分布式文件系统、分布式缓存、注册中心、配置中心、消息队列在内丰富的云生态组件,提供了一致性的多园区环境,极大提高了系统的运维效率。运用服务网格理念,将技术功能沉淀为可复用的容器组件,赋予技术组件独立开发、部署与伸缩的能力。

三是灵活的弹性与分布式。山东工行基于分布式注册中心、配置中心和分布式数据库为应用构建了完整的基础分布式能力,基于PaaS为应用提供了弹性伸缩能力,同时基于自研的服务网格提供了弹性的技术组件插拔能力。即可解耦业务与技术,又可满足多元化需求;即可快速应对流量洪峰,又可闲时节约资源。

四是具备高可用容灾能力。山东工行依托多园区架构采用分布式技术,构建应用多节点冗余架构提升应用高可用水平,确保部分节点故障时业务仍能无缝切换、持续运行;依托异地灾备体系,在不同地理区域同步并备份关键数据与应用系统,以应对极端灾备场景,实现数据不丢失、业务不停摆。

三、项目技术方案

山东工行云计算生态技术架构如下图所示:

云计算底座采用国芯服务器和国产操作系统,提供虚拟化国产计算节点或国产化物理计算节点。

应用服务编排平台PaaS,以Kubernetes为基础,自研PaaS管理平台,提供可视化的应用管理、模板编排、弹性伸缩和镜像管理等功能。引入Prometheus增强节点、流量、POD、容器、进程等监控能力,提供可视化的“云眼”监控能力;依托自研的智能安全运维平台实时分析云平台运行数据,提供及时告警、提前预警和异常自动化处置的“云医”运维能力;对接自研的创新研发协作平台,拓展应用版本的持续交付能力。

云生态组件介绍如下:

(1)软负载均衡:负责提供PaaS接入支撑、业务负载均衡调度、灰度发布、分行互联网接入等业务需求。基于7层HTTP协议解析请求数据,通过请求的域名、上下文根、URL参数、cookies、header等参数等实现负载策略;7层负载策略模式下,SLB分别与上下游服务器单独建立TCP连接。第一层负载节点由ELB实现高可用模式,仅实现四层负载均衡功能;第二层负载节点由HAProxy组成,实现七层负载均衡功能;

(2)分布式文件系统:面对海量交易数据、影像资料及日志文件的高效存储需求,基于分布式文件系统,采用多副本冗余架构与智能分片策略,实现PB级数据的高可靠存储与毫秒级检索,支持跨园区的全局命名空间统一访问。在性能层面,结合内存缓存加速和SSD分层存储技术,可承载每秒百万级文件读写,满足联机业务和批量场景需求;

(3)分布式缓存:针对高频业务瞬时流量洪峰,该系统基于Redis集群,优化多级缓存与智能分片策略,支持每秒千万级请求吞吐与亚毫秒级响应。通过多活数据同步引擎,实现跨园区缓存数据的强一致性,并集成动态热点探测机制,自动识别高频访问数据并优化存储节点分布。在容灾层面,依托内存冗余与秒级故障切换能力,保障99.99%的高可用性;

(4)注册中心:基于Zookeeper集群的注册中心,具有分布式一致性特点,是分布式服务治理的核心,构建了分布式应用服务注册和服务发现的枢纽。支持微服务、云原生及传统应用的无缝接入,自研智能流量调度与动态服务存根管理,实现百万级服务实例的秒级注册与精准发现。面向业务高可用需求,提供跨园区的多活同步能力,结合服务健康检查,保障服务状态实时感知与故障秒级剔除;

(5)配置中心:采用分布式架构与多活容灾机制,支持百万级配置项的统一管理,实现秒级推送与毫秒级生效。通过多环境多集群、灰度发布、参数加解密和参数访问控制能力,支持配置版本回溯与闪回,支撑应用和分布式服务的动态治理;

(6)消息队列:建设Kafka集群提供消息处理能力。运用其高吞吐、低延迟特性,支持每秒百万级消息处理。Topic采用分区多副本架构与持久化存储机制,确保数据零丢失与高容错性。通过发布-订阅模式实现实时数据流传输,广泛应用于同步转异步、日志聚合、事件溯源、实时监控等场景;

(7)日志中心:由ElasticSearch、Logstash、fluented等组件组成。采用分布式实时计算架构,支持日志毫秒级采集与PB级数据存储,通过灵活的策略配置实现索引的动态创建和归档,通过合理的分词和关键字规划实现日志的秒级检索。同时,运用日志数据,建设可视化大屏监控与自动化根因分析,保障业务连续性及安全运营。

山东工行在完成分布式云计算生态的探索和建设后,将生态组件平行扩展至多地多园区,为应用构建多园区多活架构基础环境。多园区入口由高可用的分布式国产化Web服务集群形成网关能力实现统一接入,集群支持动态配置且各节点配置文件强一致,即可保障最短通讯路线至应用,又能在部分园区异常时,正常园区节点依托智能DNS接管异常园区流量。

基于多地多园区云计算生态的多活应用案例如下图所示:

四、项目过程管理

根据项目建设目标和要求,项目采用增量型开发方法。在通过立项后,项目经理组织项目重要干系人、应用架构师、技术架构师参与需求会议和需求访谈,充分收集并定义需求,形成需求跟踪矩阵和范围基准。

基于工作分解结构,项目团体梳理项目活动,制定了项目进度计划,确定了分五个里程碑阶段逐步上线。

第一阶段持续2个月,基于国芯服务器和国产操作系统,建设分行国产化PaaS、国产化软负载均衡环境,为分行应用提供全栈国产化运行时环境和多副本负载均衡能力;

第二阶段持续6个月,持续拓展和建设分布式云计算环境和服务,包括日志中心、配置中心、注册中心、共享存储、分布式缓存、消息中间件等分布式基础能力;

第三阶段持续3个月,建设技术组件服务化能力,建成服务网格和管理体系;

第四阶段持续2个月,在多园区建设同模云计算平台,形成多园区云计算生态;

第五阶段持续1个月,建设智能网关,增强多园区的统一接入能力,形成多园区多活架构;

五、运营情况

云计算生态全平台年可用率99.99%,服务省内6000余万机构、企业和个人客户;

支撑336个应用部署,平台POD数量1200余个、容器数量3000余个;

平均每日承载联机交易50余万笔,批量业务80余万笔;

平台累计自动告警225次、自动预警32次,故障自愈187次。

六、项目成效

山东工行多地多园区云计算生态成效体现在以下几点:

1、支撑自主可控:多地多园区云计算生态综合了设备和服务的精细化、智能化管理,提供全栈国产化技术底座,承载全部应用、服务和设备,为全面自主可控夯实数字基建;

2、夯实云计算生态:平台以分布式云计算为底座,提供完善的自主可控的分布式缓存、分布式消息中间件、分布式文件系统、分布式搜索引擎等高可用通用云计算组件,形成高水平、功能丰富的自主可控云计算生态;

3、提升需求响应速度:云计算生态对接DevSecOps,支持敏捷的交付模式,充分保障应用安全、有效缩短部署时间、有力提升变更成功率,以快速响应业务需求;

4、提升运维效率:云计算生态包含自动化遥测、巡检等灵活任务调度能力,为开发和运维人员提供开放式的即时配置能力,提高智能化探测密度,充分提升运维效率,降低人力成本;

5、保障业务连续性:云计算生态实时监测和分析系统并发数量、会话统计和网络开销等,运用弹性计算技术手段,实现及时发现并解业务和应用运行时潜在的阻塞点,充分保障信息系统的业务连续性和稳定性;

6、数智化运营:云计算生态通过分布式服务治理、调用关系追踪和网关接入分析等技术,收集并统计汇总了丰富的业务和应用运营数据,形成了可靠的运营数据基础,为业务画像、应用画像刻画提供数据基础,进而促进业务创新和技术发展。

山东工行多地多园区云计算生态将技术和经验沉淀入平台,依托平台的深度、密度和广度,为应用提供多角度、全方位、智能化的生态化场景支撑,充分应对当下环境变化快、服务要求高、安全能力强的新形势,持续保障山东工行信息系统的安全稳定运行。

七、经验总结

山东工行多地多园区云计算生态的建设,是工商银行山东省分行在数智化转型过程中的重要战略举措,是IT架构全栈国产化的基石。项目分阶段实施,逐步完成了国产化PaaS平台、分布式基础能力(如日志中心、配置中心等)、服务网格管理体系的建设,并在多园区扩展同模平台,最终形成智能网关统一接入的多活架构。项目的成果显著提升了山东工行的自主可控能力、需求响应速度、运维效率和业务连续性,构建了全栈国产化、分布式高可用的云计算技术架构,提升了业务系统的敏捷性、弹性和容灾能力,为应对日益复杂的市场环境和客户需求夯实了基础,为数智化转型提供了坚实的技术支撑。该项目不仅为银行业务的快速创新和安全稳定运行提供了坚实的技术保障,也为金融行业数智化转型提供了可复制的案例。未来,山东工行将继续深化云计算生态的智能化与场景化能力,进一步推动技术与业务的深度融合。

更多金融科技案例和金融数据智能优秀解决方案,请在数字金融创新知识服务平台-金科创新社案例库、选型库查看。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
原创 最... 近日,有关华为nova 13系列手机的消息开始多了起来,之前透露的消息暴露,华为nova 13 Pr...
2024信号“最可靠”的四款手... 大家好!今天我要和大家聊聊2024年信号“最可靠”的四款手机,它们分别是华为Pura 70 Pro+...