大会进入第二天,DTCC 2025的火热持续不断!
在智能化技术加速渗透的背景下,数据库领域正经历一场深刻的架构重构革命。如何让分布式系统在扩展性不衰减的前提下实现强一致性?如何将开源生态的"碎片化创新"转化为"标准化生产力"?如何让数据库从被动承载数据的工具进化为主动优化业务的智能体?今天的主题分享,为我们带来了下一代数据库技术变革的新范式!
开源协力引领数智化未来
▴华为技术有限公司、华为计算产品线鲲鹏领域openGauss研发总监 熊钦
开源五年来,openGauss以技术竞争力为核心,在伙伴生态、商业应用、技术影响力和社区建设等方面取得了长足发展。2024年,openGauss系数据库在线下集中式新增数据库场景中占据30.2%的市场份额,并荣获中国通信协会科学技术进步一等奖。众多合作伙伴如中国移动、海量数据、南大通用等积极参与生态建设,共同推动技术进步。
在大会的主题分享中,熊钦具体介绍了社区的最新发布以及自身产品的持续迭代。其中,openGauss 7.0.0版本聚焦AI时代需求,在多个核心技术领域实现重大突破。在HTAP一体化方面,针对传统数据库中OLTP和OLAP业务存在的资源争抢、数据冗余等问题,openGauss 7.0.0通过行列融合技术实现了HTAP一体化架构。在HyBench测试中以1713分的成绩位居榜首,性能超越第二名200多分。在中国移动在线双中心业务实践中,通过精准算子优化实现了整体性能10%的提升,部分子业务场景性能提升近一倍。
在DataVec向量数据库引领AI创新方向上,DataVec实现了底层硬件亲核优化,检索性能领先业界30%。更重要的是,openGauss创新性地实现了"四库合一"——在一个数据库中集成向量、关系、图、全文检索四种能力,实现开发接口、部署和运维的统一,大幅降低开发和运维负担。结合可信执行环境,为用户私域数据和大模型提供安全保护。
而在重要的AI for DB智能运维革命过程中, openGauss实现了端到端智能自治服务,解决了传统数据库运维中模型泛化性差、复杂问题处理困难等痛点。基于SOTA大模型、向量数据库能力、DB Agent和DBMand工具链,实现了从天级到分钟级的运维效率提升。多Agent机制支持复杂故障的交叉检视和精准定位,智能问答功能通过多模数据融合检索提升准确率与实时性。
展望未来,openGauss将围绕高性能、高智能、高可用、高安全四大方向持续发力,重点推进三大特性:oGRAC多读多写能力(已经在今年6月的openGauss开发者大会上开源)持续精进;深化AI for DB和DB for AI能力;发展serverless特性以适应AI场景下大模型无状态调用需求。
通过持续的技术创新和生态共建,openGauss正朝着成为数据库行业坚实底座的目标稳步前进,为数字基础设施建设提供强有力的技术支撑。
架构重构势在必行
▴中国人民大学企业导师李海翔
当前主流数据库架构长期存在重度耦合的顽疾,事务处理逻辑与存储引擎深度绑定,这种架构存在很多设计上的弊端。
首先,逻辑不清。模块间高度依赖,单点修改易引发系统性风险,维护成本陡增。
其次,普适性缺失。系统难以灵活扩展或适配新场景,制约响应速度与创新空间;
其三,核心抽象缺位。“一致性与并发”作为事务层面乃至并发系统的最高抽象法则,未能在架构中获得应有地位,其作为“世界运行的大道法则”的价值被严重低估。
在李海翔看来,数据作为国家确立的“第五大生产要素”,其高效、可靠处理需求日益凸显,传统架构已无法满足智能化时代对系统灵活性、稳定性与效率的严苛要求。重构势在必行,其核心在于回归并发系统设计三原则:
1. 优先原则。确立“一致性与并发”为架构设计的最高优先级;
2. 解耦原则。彻底分离事务引擎与存储引擎,打破历史耦合;
3. 独立原则。使事务引擎成为可独立演进、融入操作系统乃至更广泛系统的通用核心模块。
这一重构方向直指未来软件发展的关键趋势,即模块化、组件化与智能化。通过解耦,系统将获得“灵活(Flexible)、稳定(Stable)、高效(Efficient)”的卓越特性。展望未来,更高级的抽象组装机制、跨语言平台的模块互操作性,以及AI驱动的智能模块推荐与组合,将共同推动数据库乃至整个软件生态向“搭积木”式的敏捷构建演进。
李海翔的干货分享说明,数据库的终极进化,不仅在于技术的精进,更在于对“一致性与并发”这一底层法则的深刻认知与系统性应用,这将是支撑数据要素价值释放、驱动智能化变革的底层基石。
金融全场景应用数据库创新改造做到“应去尽去”
▴太平洋保险数智研究院首席数据库专家林春
在金融行业数字化转型的深水区,中国太保集团以"应去尽去"的坚定决心,打造了全业务域、全场景应用的数据库创新改造标杆,是"业内首个全险种核心系统升级"的成功实践者。
据林春介绍,截至2024年底,集团已完成300余个系统的数据库升级,不仅实现从集中式架构向分布式架构的华丽转身,更以创新工具与方法论突破行业瓶颈,将商业数据库转型总成本降低30%以上。
中国太保集团的转型实践精准呼应《金融科技发展规划(2022-2025年)》"以应用场景为牵引推动关键核心技术迭代"的要求。面对互联网金融业务高并发、多频次、海量数据的挑战,太保集团以OceanBase为核心构建弹性架构——硬件故障自动切换时间压缩至13秒内,存储压缩率提升至原容量的1/3~1/4,备份恢复性能飞跃5倍。尤为亮眼的是自研"指南针"预评估工具,依托超1000条保险场景知识库,覆盖600余项检查指标,将问题识别效率提升60%,数据库瘦身达PB级,为行业填补了国产化改造评估的空白。
在攻坚核心系统"深水区"过程中,太保创新提出分布式架构三大突破:针对综意险系统首 创"分区分组+逻辑分区预留+智能路由表"方案,支撑百万级QPS并发,批量投保效率提升9倍;针对冷热数据分离难题,开发原生分布式冷热分离技术,在不改动业务代码前提下实现50TB+系统平滑扩容;独创索引优化方法论,精准解决表连接顺序导致的索引失效问题。这些实践不仅沉淀为行业首部《金融数据库转型实战》专著,更培养出上千名持证数据库专业人才,形成从"选改迁运"全链路的创新解决方案。
当金融行业仍在核心系统改造的迷雾中摸索,中国太保以架构转型筑牢业务发展底座,以技术创新守牢安全底线,用30%的成本降幅与100%的出单成功率证明:数据库不仅是技术底座,更是金融高质量发展的新引擎。这场始于数据库却不止于数据库的变革,正为同业提供可复制、可推广的"中国方案"。
业务领域专用智能体重塑生产力新格局
▴中国国新集团国新健康数字办主任 常耀斌
在人工智能重塑千行百业的浪潮中,通用大模型的局限性日益凸显,而聚焦垂直领域的专用智能体正成为产业数智化转型的关键突破口。
常耀斌认为,构建真正有价值的业务领域专用智能体,需要深刻把握"战略为本、场景为土、数据为基、AI为向"的黄金法则。这类智能体如同"专业领域博士",通过深度挖掘行业知识图谱,在精准度、专业深度、推理效率和数据安全四大维度实现质的飞跃——不仅能够精准捕捉特定领域规律,更能基于本地化训练保护医疗、金融等敏感领域的数据隐私,为行业提供"高可靠、高安全、高适配"的智能解决方案。
要想成功构建业务领域的专业智能体引用,其技术内核源于Transformer架构的注意力机制革新。如同人脑处理信息时会自动聚焦关键要素,专用智能体通过自注意力机制从海量行业数据中提取特征,将"query- key-value"的关联逻辑深度融入业务场景。以医疗健康领域为例,朝阳区构建的专病数据平台已形成覆盖千家医院的临床研究协同网络,而个人健康数据空间则打通了三甲医院与社区医院的诊疗壁垒,实现了双向转诊与远程会诊的全链条服务。
另外,专用智能体构建其实有一个清晰的路径。首先,明确业务价值目标,继而通过需求分析锁定核心痛点;其次依托行业知识库进行数据清洗与标注;再针对业务特性选择模型并微调;最终完成技术架构搭建与系统集成。在医药健康领域,这种"数据+研究+产业"的联动模式,正加速创新药物研发进程,为"9+6"战新产业中的生物技术、人工智能和未来健康等方向注入新动能。
当通用智能体在复杂业务场景中频频"水土不服",业务领域专用智能体却以"小而精、专而强"的优势破局而出。已经不仅是技术工具革新,更是产业创新的催化剂——通过低代码化降低应用门槛,借助跨领域融合催生新业态,正在医疗、法律等垂直领域掀起效率革命。