IT时报记者 郝俊慧
如果你问数据库领域的研究者,世界上最难同时拿到的三张“入场券”是什么?VLDB、IEEE ICDE和ACM SIGMOD或许会是一种答案。这三个国际数据库领域公认的顶级学术会议,代表着全球数据库理论研究与系统研发的最高学术水准和技术风向标,也是衡量科研团队和产业界数据库创新能力的核心标尺。
2026年初,中国电信云计算研究院(简称云研院)宣布,多项研究成果及论文同步入选VLDB 2026、IEEE ICDE 2026和ACM SIGMOD 2026,实现了三大顶会的“大满贯”。
3月4日,《IT时报》记者从云研院了解到,尽管三篇入选论文分属不同技术路线,却形成了面向新一代数据基础设施的整体布局:向量检索解决“如何快速找到”,元数据管理解决“如何稳定存好”,无服务器图计算解决“如何高效算出”,三者共同构建了“查得快、存得稳、算得省”的数据基础能力闭环。
以发表于VLDB 2026的《面向基于图的磁盘驻留近似最近邻搜索的 I/O 优化:设计空间探索》为例,起点是为了解决一个让工程师头疼已久的现实问题:当大模型和RAG(检索增强生成)应用快速铺开时,向量数据库的查询性能瓶颈在哪里?
研究团队通过实测发现,在基于固态硬盘(SSD)的图索引向量检索中,I/O操作占据了整体查询延迟的70%至90%。换句话说,每次检索,系统大部分时间都花在等待磁盘把数据搬运过来,而不是真正用于计算。
论文显示,由云计算研究院独立研究的大规模向量数据检索技术,围绕磁盘驻留向量检索的读写性能优化进行了系统性研究,从而为大规模语义检索提供了高性能、低成本的工程化方案。
另一篇发表于IEEE ICDE 2026的独立研究论文,则尝试为大规模分布式存储系统存在已久的元数据管理难题提供一种新的解法。
云与人工智能的火热为分布式存储系统带来了极大的查询压力,而每次查询所进行的多次权限校验和路径解析是主要性能瓶颈。研究团队发现绝大多数的元数据存在特殊的"权限递减"模式,并针对性设计了一种高性能的推测性权限校验技术,显著降低了海量文件管理的计算复杂度,为超大规模数据中心提供了高可扩展的存储支撑能力。
此外,云研院还与上海交通大学计算机学院云计算联合实验室共同研发了在无服务器服务上通过分离式架构实现高效图数据处理的技术。
无服务器计算的吸引力在于弹性——资源按需分配,用多少付多少,不需要预先购买和维护固定规模的服务器集群。但图计算天生是一种“数据密集型”任务:图的结构数据规模庞大,节点之间的关联关系复杂,计算过程中需要大量跨节点的数据交换,这与无服务器架构“函数无状态、实例短暂”的设定存在矛盾。
论文提出了一种分离式系统架构与高效通信机制,实现了性能与成本的协同优化,被收录于ACM SIGMOD 2026。
组建不足两年,便实现了数据库三大顶会的论文“全收录”,中国电信云研院这个成绩在央企背景的研究机构中,实属首次。
AI行至今日,各大厂商竞争的焦点正逐渐从算法模型转向数据,尤其在当前国际竞争格局下,数据库和基础软件的“自主创新”已是生存必选项。
这三篇论文,本质上是中国电信对于为何布局云研院的回答。作为国资云的排头兵,中国电信承担着“勇闯无人区”的重任,必须在最难啃的“硬核”领域——存储引擎、查询性能、计算优化等方面建立起防线。
“云计算研究院是中国电信在关键核心技术领域攻关的尖端阵地和原创技术的策源地之一。”中国电信首席科学家、中国电信云计算研究院院长吴杰告诉《IT时报》记者,从成立开始,云研院便始终坚持在深化数据库与大数据基础技术方面持续布局,核心逻辑是建立一条“基础研究——核心技术——产业应用”的全链条路径,推动重要科研成果加速转化为可复用的核心技术能力,并融入天翼云平台能力体系,推动关键底座能力持续增强,不断提升天翼云自主创新水平与体系化竞争优势,为经济社会发展提供更加坚实的底层技术支撑。
目前,吴杰已受聘为中国数联物流首席科学家咨询委员会委员,并参与上海市可信数据流通与治理重点实验室学术委员会相关工作,持续推动数据流通、治理与基础软件的产学研协同发展。