扩张与洗牌并存 国产GPU厂商发力AI生态
创始人
2024-09-25 12:42:31
0

证券时报记者 王一鸣

前几年广受资本追捧的GPU(图形处理器)这一硬核赛道正在步入洗牌期,一些原本备受瞩目的通用GPU设计企业先后陷入经营困境。与此同时,有头部企业继续求新求变,已步入AI(人工智能)核心战场。

对于行业现状,北京社科院研究员王鹏向证券时报记者分析,当前国产GPU产业处于快速发展与洗牌并存的阶段。一方面,随着AI大模型的需求激增,国产GPU市场迅速崛起,涌现出如摩尔线程、壁仞科技等一批具有创新能力的企业。这些企业在技术研发、产品创新等方面取得了显著进展,为国产GPU行业注入了新的活力。另一方面,市场竞争也日益激烈,部分初创企业由于资金链断裂、技术瓶颈等问题陷入困境,甚至面临裁员、诉讼等风险。

“长远来看,国产GPU行业仍具有广阔的发展前景。这源于人工智能、大数据、云计算等技术的快速发展,对高性能GPU的需求持续增长;同时,国家政策对半导体产业的支持力度不断加大,为国产GPU行业提供了良好的发展环境。此外,随着国产芯片公司在生态构建、技术创新等方面的不断努力,国产GPU有望逐步缩小与国际领先水平的差距。”王鹏说。

几家欢喜几家愁

近日,国产GPU独角兽壁仞科技一则动态引起业内关注。该公司在上海证监局办理IPO辅导备案登记,辅导券商为国泰君安。这是继今年8月26日燧原科技辅导备案报告公布后,又一家启动IPO的上海AI芯片企业。

壁仞科技创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。截至目前,公司已完成多轮融资,公开融资总额超过50亿元,投资方包括启明创投、IDG资本、中芯聚源、格力创投等。

目前,壁仞科技首款国产高端通用GPU(GPGPU)壁砺系列已量产。在9月举行的2024全球AI芯片峰会上,壁仞科技还首次公布了其自研的异构GPU协同训练方案,该方案突破了大模型异构算力孤岛难题,实现了在本土异构多GPU芯片算力训练技术领域的首次突破。

另一家国内GPU独角兽企业也有新动作。今年7月,摩尔线程宣布对其夸娥(KUAE)智算集群解决方案进行重大升级,从当前千卡级别大幅扩展至万卡规模。摩尔线程创始人兼CEO张建中表示,在多元趋势下,万卡已是AI模型训练主战场的标配。

事实上,在国内,万卡集群建设正高歌猛进。去年7月,华为昇腾AI集群规模从最初的4000卡集群扩展至16000卡,是国内首个万卡AI集群。

不过,当前国产GPU产业的分化亦十分明显,一些原本备受瞩目的企业接连陷入困境。今年8月底,曾获得2024年度重庆市“独角兽企业”称号的象帝先被曝约400位员工被裁。公司在回应中坦陈:“发展面临一定的市场调整压力……正在进行组织结构和人员配置的优化等……并寻找外部融资机会。”另一方面,象帝先股东还在起诉其创始人唐志敏,因其未能筹集到承诺的5亿元B轮融资。

在象帝先陷入困境之前,同处在GPU赛道的砺算科技也曾预警。至今年8月19日,东芯股份公告拟以不超过2亿元收购砺算科技37.88%股份,砺算科技的资金紧张局面方得以缓解。

GPU占AI芯片

八成份额

在中关村物联网产业联盟副秘书长袁帅看来,当前国产GPU行业处于一个复杂而关键的转型期,短期行业出现降温和分化,主要是由于市场竞争加剧、技术门槛提高、资本退潮等因素导致企业资金压力增大。在此背景下,部分实力较弱的初创企业在面对挑战时往往更加脆弱,而头部企业则凭借其技术实力、市场布局和资金优势逐渐崭露头角。

按定义和应用看,GPU起初是一种显示芯片,用于加速计算机上的图像处理。随着技术进步和应用范围的扩大,GPU衍生出了GPGPU,后者是通过利用GPU并行处理能力特别强、计算能效比高的特点,处理更为复杂的计算任务(如AI模型训练与推理等)。基于此,如今的GPU已被广泛应用于人工智能、虚拟现实、游戏、科学计算等诸多领域。

IDC数据显示,预计到2025年,GPU仍将占据全球AI芯片八成市场份额。Gartner此前预测,2023年全球人工智能芯片(包含GPU、TPU等)的市场规模达到530亿美元,并预计在2024年增长至671亿美元。到2027年,全球人工智能芯片市场规模预计达到1194亿美元。

从行业格局来看,作为GPU的发明者,英伟达占据绝对领先地位。Jon Peddie Research(JPR)数据显示,2024年第一季度英伟达的全球AIB显卡(也称独立GPU)市场份额飙升至88%,而AMD的市场份额下降至12%。JPR预计,2024年第二季度,AI训练器GPU的出货量将继续增加,而游戏AIB市场可能持平或走低。在AI芯片主战场,据TechInsights数据,英伟达2023年的数据中心GPU出货量约为376万片,比2022年多出近100万片,市场占比98%,收入达362亿美元。压倒性击败了AMD和英特尔等竞争对手。

微软公司和Meta等数据中心运营商使用英伟达的芯片来开发和运行AI模型,巨大的需求使其销售额和股价飙升。英伟达市值在今年6月曾登顶全球第一,达到3.33万亿美元。最新财报显示,在英伟达Hopper(GPU构架平台)、GPU计算和网络平台强劲需求的推动下,公司数据中心今年第二季度收入达到262.72亿美元。

英伟达达成如今成绩凭的是什么?袁帅告诉证券时报记者,这主要源于英伟达在GPU设计、制造工艺以及软件优化等方面具有深厚的技术积累,其产品在性能、功耗比和稳定性等方面均处于行业领先地位。同时,该公司建立了完善的生态系统,包括CUDA平台、软件开发工具包(SDK)以及丰富的第三方应用支持等,为开发者提供了便捷的开发环境和广泛的应用场景。

“英伟达的芯片产品先进且功能强大,配套软件生态完善渗透率高,并且产品迭代进化速度快速,所以市场地位尚难以撼动。”深度科技研究院院长张孝荣认为。

机遇和挑战并存

国内市场方面,自2019年以来,一批国产GPU初创公司先后成立,其中涌现了壁仞科技、摩尔线程、燧原科技等AI芯片设计独角兽。同时,还有一批老牌芯片设计公司也入局GPU领域。

这些公司的机会在于美国出口管制背景下的国产替代。2022年10月,美国政府禁止英伟达向中国出口高性能H100、A100芯片。英伟达随后专门面向中国市场推出了不违反美国出口管制要求的A800和H800芯片,至去年10月,这两项芯片也被限制。2024年2月,英伟达向中国市场特供的H20芯片接受预订,但该芯片与H100配置相比,GPU核心数量减少41%,性能降低28%。对此,英伟达2023年11月曾透露,数据中心业务两成以上受出口管制影响。

与此同时,国内GPU厂商正迎头赶上。IDC在2023年中发布的一项中国AI加速卡(公开市场)出货量统计显示,2022年上半年到2023年上半年,中国AI加速卡出货约109万张,英伟达市场份额为85%,华为市占率为10%,百度市占率为2%,寒武纪和燧原科技均为1%。

从国内产品成果来看,不仅华为昇腾系列表现突出。2024年5月份,摩尔线程与智谱AI开展了新一轮GPU大模型适配、性能测试。结果表明,在推理方面,摩尔线程自研全功能GPU显著优于基准对比产品RTX 3090和RTX 4090;在训练方面,摩尔线程夸娥千卡智算集群的训练精度与A100集群相比,误差在1%以内,而集群性能扩展系数超过90%,模型算力利用率(MFU)与A100集群相当。

壁仞科技则于2022年8月推出采用7nm制程的GPGPU芯片BR100,该芯片峰值算力达到国际厂商彼时在售旗舰产品3倍以上,创下国内互连带宽纪录。

不过,挑战也随之而来,一些行业领先企业先后被美国政府“盯上”。2022年12月,寒武纪等36家被美国政府列入“实体清单”。2023年10月,壁仞科技、摩尔线程等亦被添加到实体清单中。

这对相关企业影响几何?寒武纪在2024年半年报中表示,公司及部分子公司已被列入“实体清单”,将对公司供应链的稳定造成一定风险。受“实体清单”等供应链不利因素影响,公司上半年营收6476.53万元,较上年同期下降43.42%。

生态建设待完善

王鹏指出,当前国际政治经济环境的变化对GPU行业产生了一定影响。特别是美国对中国AI产业的打压政策限制了国内相关企业的进口渠道和供应链稳定性。

袁帅向证券时报记者表示,在面临外部封锁前提下,国产GPU厂商要站稳脚跟并在高端AI芯片领域争得一席之地并非易事。在硬件层面,国内芯片代工企业在高端工艺和产能方面相对不足,难以完全满足国产GPU设计厂商对高端AI芯片的生产需求;在软件层面,英伟达等国际巨头在软件生态(CUDA等)和IP授权方面拥有强大优势。国产GPU厂商在构建和完善软件生态以及获取关键IP授权领域仍显薄弱。

事实上,CUDA被业内普遍认为是英伟达最大护城河。英伟达CEO黄仁勋在今年也曾强调CUDA软件系统生态对于AI时代的重要性。“目前,CUDA已实现良性的发展循环,全球拥有500万开发者,覆盖医疗保健、金融服务、计算机行业、汽车行业等领域。”黄仁勋说。

中国工程院院士,高性能计算研究所所长郑纬民在今年7月7日的信息化百人会上指出:“这些年国产芯片无论是软件硬件都有很大的进展,但是用户不太喜欢用,原因是国产卡的生态系统不太好。”

郑纬民认为,这需要做好系统设计和相关软件优化,具体包括十个方面:编程框架、并行加速、通信库、算子库、AI编译器、编程语音、调度器、内存分配系统、容错系统、存储系统等。在他看来,在国产算力支撑大模型训练时,国产AI芯片只能达到国外芯片60%的性能,但如果把前述十个方面的软件生态做好了,客户也会满意。

国泰君安在今年3月发布的《重视AI芯片配套的软件生态》报告中总结:谁能做出中国版“CUDA”,就能占领AI算力高地。国内各大厂商已在GPU生态上积极布局,包括驱动程序、开发工具、应用程序接口(API)等,以确保其产品能够更好地服务于人工智能、大数据处理、云计算和游戏等多样化的应用场景。例如,华为推出了CANN以及对应的生态体系,力求突破技术瓶颈。此外,像景嘉微、摩尔线程等公司也在自主研发GPU产品,并努力打造与之兼容的软件环境,以减少对外部供应商的依赖,提升国产GPU的市场竞争力等。

相关内容

热门资讯

华为发布ICT人才实训解决方案... [中国,上海,2024年9月19日] 华为全联接大会2024期间,在以“助力ICT人才培养,共赢数智...
微波传输赋能空管保障联合创新实...   鲁网9月30日讯近日,济南联通与民航山东空管分局共同开展双路由光缆中断后的微波系统保护演练,系统...
湖南各地广泛开展“传承红色基因... 为庆祝中华人民共和国成立75周年,湖南各地积极组织开展“传承红色基因·向国旗敬礼”主题实践活动,引导...
我国成功发射首颗可重复使用返回... 记者从国家航天局获悉,9月27日18时30分,我国在酒泉卫星发射中心采用长征二号丁运载火箭,成功发射...
华为Mate XT刷屏,东莞走... 华为Mate XT刷屏,东莞走到台前。 在Mate XT发布之际,东莞发布“骄傲”地宣布:火爆全网的...
“解码未来:全球数智趋势”专题... 中新网上海新闻9月26日电(记者 姜煜)“解码未来:全球数智趋势”专题论坛25日在上海浦东成功举办。...
大跳水!华为三折叠手机黄牛价暴... 来源:科技新知V 华为首款三折叠手机Mate XT上市初期受到黄牛热炒,但由于实际需求不足和定价过...
西南油气田:智能化建设推动气田... 7月24日,西南油气田铁山坡智能气田建设项目经中国石油专家组评审,以综合评价为“优”的成绩顺利通过验...
荣耀品牌手机哪款性价比高质量好... 大家好!在智能手机的浩瀚星空中,荣耀100与荣耀200无疑是两颗璀璨的明星。今天,我们就来聊聊这两款...
华为与威努特正式签署鲲鹏全面合... [中国,上海,2024年9月19日] 在华为全联接大会2024(HUAWEI CONNECT 202...