图说:腾讯Angel机器学习平台荣获本年度领先科技奖 来源/采访对象提供(下同)
11月19日,2024年世界互联网大会领先科技奖在乌镇发布,腾讯Angel机器学习平台凭借其卓越的技术积累、创新的关键技术和广泛的应用场景,荣获本年度领先科技奖。
腾讯Angel机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展,提升社会效率。
世界互联网大会领先科技奖由世界互联网大会主办,旨在奖励全球年度最具领先性的互联网科技成果,倡导互联网技术国际交流合作。本年度共有20个具有国际代表性的项目获奖,整体入选率仅为7.4%,涵盖类脑计算、具身智能、6G、大数据、高性能芯片、AI机器学习平台等前沿领域。
腾讯公司副总裁蒋杰现场表示,获得本次世界互联网大会领先科技奖,是对腾讯在大模型相关自研技术的认可。在大模型时代,模型参数超过万亿,训练数据超过十万亿,如此庞大的规模,给模型训练和推理带来巨大挑战,腾讯全链路自研的Angel机器学习平台有效应对这些挑战,实现多个方面的性能效率提升。未来,腾讯也将继续投入底层技术自主研发,并通过开源共享,推动技术创新升级,让智能技术走入千行百业。
腾讯Angel机器学习平台针对万亿规模大模型分布式训练和推理、应用部署难的挑战,在网络互联、框架效率、平台规模三方面实现了突破。
在通信方面,从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单节点带宽达到3.2T,相比于同类领先产品,性能提升30%,成本降低70%。
在效率方面,自研了训练/推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。
在规模方面,实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。
作为智能时代的基础设施,凭借扎实的技术积累,腾讯Angel机器学习平台项目技术成果此前也多次登顶国际权威领域榜单,获得20余项国际竞赛冠军。Angel平台还是中国首个从Linux Foundation毕业的顶级AI开源项目,被评为2019年度最受欢迎中国开源软件,平台吸引了众多外部开发者和企业用户,促进了技术的广泛应用和产业的协同发展。2024年3月,腾讯Angel机器学习平台还获得了2023中国电子学会科技进步一等奖。
腾讯基于Angel机器学习平台全链路自研的混元大模型,在中国众多头部AI研发企业中率先采用混合专家模型(MoE)结构,模型规模突破万亿,处于中国大模型第一梯队。11月初,腾讯推出业界最大参数规模的开源MoE模型混元Large,总参数量389B,激活参数量52B,上下文长度高达256K,其训练和推理均基于腾讯Angel机器学习平台。