使用国产芯的“神威·太湖之光”到底有多强?
2016年6月,世界首台峰值运算能力超过每秒10亿亿次、拥有千万核的超级计算机“神威·太湖之光”(以下简称“太湖之光”)在无锡诞生。更令人振奋的是,该套系统实现了包括处理器在内的所有核心部件全国产化。
走进国家超级计算无锡中心(以下简称“无锡中心”),1000平方米的房间内,记者看到了“太湖之光”的“真身”:由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4组由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“太湖之光”共有40960块处理器。
神威太湖之光超级计算机
开机一分钟地球人算32年,“超级大脑”背后的“中国芯”
“太湖之光”究竟能有多快?
“简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”无锡中心副主任刘钊向记者这样解释。
超强算力的背后,是峰值性能超过3万亿次的“申威26010”异构众核处理器的加持。“太湖之光的每一块处理器,都是我们自主研发的申威26010,别小看这个只有25平方厘米的薄块,它不仅是‘太湖之光’的心脏,更是中国打破技术封锁的一柄利器。”刘钊的脸上写满骄傲,“每一块处理器相当于50多台常用笔记本电脑的计算能力,40960块处理器组装到一起,速度之快可想而知。”
申威26010芯片
从1950年代开始摸索,到1980年代第一次研制成功每秒上亿次超级计算机,到 “天河一号A”首次问鼎全球超算宝座,再到2016年采用国产异构众核处理器的“太湖之光”全新亮相,中国超算发展筚路蓝缕,在世界高性能计算领域实现了从“跟跑”到“领跑”的历史跨越。
“‘太湖之光’是我见过的,最具美感的一台超级计算机。”1986年出生的高级工程师刘钊是无锡中心副主任。2016年,无锡中心建立之初,刘钊就来到这里工作。“2008年我从北京理工大学毕业,当时我国初步具备了研制高端超级计算机的能力,但放眼国际,我国的超算能力还处于中端水平,许多关键部件受制于人。”攻读计算机专业的刘钊逐渐明晰了自己的梦想:将知识和精力,投入中国的超级计算机事业中去。
“搬运”两百万行代码,打破“戈登·贝尔奖”零的突破
2016年,刘钊和团队面临一个巨大的挑战:“有了跑得快的硬件,还需要将硬核本领完全发挥出来的软件。”
“太湖之光”问世之初,面临的最大问题是国外经验和编程模式无法与之匹配。要解决这一难题,就要先对200多万行代码进行“翻译”,重新设计和编写,让新代码适用于国产超级计算机。
200多万行代码,是行业的“天花板”级别,也是“神威·太湖之光”实力的体现。刘钊回忆,“翻译”的关键期,大楼内部的软硬件设施和应用设备开启“机房优先”,这群平均年龄只有28岁的青年工程师,夏天靠几台大型工业风扇降温,早上8点后的楼面好像蒸笼一样热;到了寒冬,就靠着取暖器驱走严寒,燃烧起奋斗之火。
刘钊工作照
当年,无锡中心团队作出了一个雄心勃勃的举动——申报“戈登·贝尔奖”。“戈登·贝尔奖”被称为世界高性能计算应用领域的“诺贝尔奖”,自1987年设立以来,从未有中国团队获奖。
在冲刺“戈登·贝尔奖”的最后一个月里,团队成员们开启了“7×24小时”模式。“大量数据需要在‘太湖之光’上处理。办公室角落里堆放着行军床,每个人的办公桌上都摆着洗漱用品。”刘钊说,他们有时候每天只睡两三个小时,经常有人忙到凌晨三四点钟才休息。大伙儿这么拼,还有一个原因,那就是怕浪费国家资源。超级计算机用电量大,“太湖之光”运行一天,电费就要十多万元。“我们通宵调试和运行程序,这样机器的利用率才能最大化。”
2016年11月17日,一年一度的“戈登·贝尔奖”在美国盐湖城正式揭晓:基于“神威·太湖之光”的“千万核可扩展全球大气动力学全隐式模拟”应用项目获奖!“听到获奖名单的那一刻,我在现场激动极了!”
戈登贝尔奖领奖现场
“戈登·贝尔”奖项评审委员会主席曾这样表示,“我们很惊讶你们有这种毅力,把这样一座‘大山’搬了过来。”“大山”指的就是百万行代码。
这件大国重器,惠及你我衣食住行
大国重器,“好用”更要“用好”。1000平方米的机房内,这台名副其实的“神算子”正有条不紊地工作着,“跑”得这么快,“太湖之光”能做什么?
“挑战速度极限从来不是超级计算机的目的,解决各种重大挑战性问题才是太湖之光的使命。”刘钊是辉煌的见证者,更是超算应用的开拓者,如何为“太湖之光”开发更多的应用场景是他思考的问题。“小到产品的设计研发、大到气象灾害的应对,人类在真实世界中试错的成本比较高,甚至全无这样的机会,而借助超级算力,就可以“跑”进未来看看,帮助我们做出最佳决策。”
自2016年6月发布以来,“太湖之光”已稳定运行8个年头,在航空航天、地球科学、海洋环境、生物医药、工业制造等20多个领域支撑了1000余项应用课题的计算任务。超级计算机还在我们日常生活中有许多应用,刘钊用3个简单的词来概况:算天、算地、算人。
“算天”,比如说天气预报、计算台风路径,超算还可以用来进行宇航器设计、研究天体物理等等。“太湖之光”曾经对“天宫一号”返回路径进行的数值模拟计算,为它的顺利回家提供精确预测。“算地”,比如“太湖之光”上研发的大地震模拟程序可以对灾害性的大型地震进行模拟,帮助科学家更好地理解地震的机理和动力学过程。“算人”,指的是与人的生活、生命健康有关的应用,比如新药研发、基因测序、脑科学等,也会用到超算。
“‘太湖之光’还和物联网技术‘联手’,对无锡老旧小区近4000部电梯进行实时监控,并对有可能发生的故障进行预警。”在刘钊眼里,神威·太湖之光”能做、要做的事情太多了。“希望‘太湖之光’能够在科技创新中继续大显神威,也能够更多地走进日常生活里,让每个人都能享受到这个科技进步带来的红利。”
扬子晚报/紫牛新闻 记者 金雨希
校对 徐珩