我国科研团队首创存算一体排序架构 攻克智能硬件加速难题
创始人
2025-07-05 21:01:35
0

记者 赵竹青

近日,北京大学集成电路学院杨玉超教授、人工智能研究院陶耀宇研究员领衔的科研团队在智能计算硬件领域取得突破,首次实现了基于存算一体技术的高效排序硬件架构。这一成果攻克了传统计算架构处理复杂非线性排序时效率低下的核心难题,为具身智能、大语言模型、智能驾驶、智慧交通与智慧城市等人工智能应用提供了全新的高效算力支持。相关研究发表于国际学术期刊《自然·电子》。

在人工智能系统中,排序通常作为数据预处理或决策中间环节存在,一旦执行效率不高,将成为整个系统的主要瓶颈。存算一体技术虽在矩阵计算等规则运算中成效显著,却因排序操作逻辑复杂、非线性强、数据访问不规则等特性,长期被视为该领域的核心难点。

北京大学团队围绕“让数据就地排序”的目标展开攻关,取得系列核心技术突破:开发了一套基于新型存内阵列结构的高速位读取机制;开创性地引入了忆阻器阵列,实现了低延迟、多通路的硬件级并行排序电路设计;在算子层面,优化了面向人工智能任务的算法-架构协同路径,同时兼容现有矩阵计算;完全自主设计的器件-电路-系统级技术栈整合。

“排序的核心在于复杂条件下的精准比较与数据搬移,传统存算一体架构难以支持此类运算。”论文第一作者、北京大学集成电路学院博士生余连风介绍,“团队创新性地设计出‘无比较器’存算一体排序架构,成功解决了这一难题。”

实测结果显示,该硬件方案在典型排序任务中提升速度超15倍,面积效率提升超过32倍,具备并行处理百万级数据元素排序任务的潜力,功耗仅为传统CPU或GPU处理器的1/10。在人工智能推理场景中,支持动态稀疏度下的推理响应速度可提升70%以上,特别适用于要求极高实时性的任务环境。

论文通讯作者、北京大学人工智能研究院陶耀宇研究员说,“正因为排序计算在人工智能中是高频、通用、基础且极难处理的一类操作,这一难题的突破意味着存算一体从‘适合特定应用’走向‘可支持更广泛的通用计算’,为人工智能相关任务构建了全链路的底层硬件架构支持。”

陶耀宇介绍,该技术具有广泛的应用前景,可用于智慧交通图像排序系统、金融智能风控评分引擎、边缘监控设备的目标优先识别模块等场景。在测试中该技术展现出高速度与低功耗的显著优势。例如,在智慧交通场景中,系统有望在毫秒级内完成十万级事件优先级评估,为超大规模交通决策、应急响应调度等提供高效的实时算力支持。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
vivo钱包遭用户投诉贷款利率... 文:WEMONEY研究室 随着移动互联网时代到来,智能手机已经成为了生活的必需品。目前,很多手机如...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
虚拟资料变现还值得做吗?闲鱼卖... 大家好,今天给大家带来的是咸鱼虚拟资料类项目分享,这个项目其实出来很久了,有些人觉得虚拟资料没水准,...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
gta5加载慢怎么办 gta5... 许多玩家在GTA5游戏过程中都会遇到加载速度慢的问题,那么gta5加载慢怎么办?今天加游加速器就来告...