马上注册,结交更多好友
您需要 登录 才可以下载或查看,没有账号?立即注册
x
算力工程师在调试设备线路。
运维工程师在对设备进行例行维护。
“巢湖明月”超级计算机。
以上图片均为阮梦生摄
核心阅读
算力是什么?对你我生活有什么影响?作为数字经济时代的新质生产力,算力的飞速发展正推动人工智能等前沿技术加速推广,进而服务科技创新、产业发展、民生保障等领域。
近年来,作为综合性国家科学中心,安徽合肥瞄准需求、抢抓机遇,建设了包含我国首个国产万卡算力集群的新一代算力集群,有力推动经济高质量发展。
打开软件,说出指令,不到5秒,一个初具逻辑的文本随即生成。
不单是文本生成,知识问答、逻辑推理、音视频制作……人工智能大模型因其丰富且便捷的功能,已成为不少人工作生活的好助手。
现今人工智能越来越“智慧”的背后,是看不见、摸不着的算力在支撑。
何为算力?顾名思义,就是计算能力,即设备单位时间可处理的信息数据量。数字经济时代,数据成为关键生产要素,算力通过对数据的分析、加工、处理,成为推动经济高质量发展的新引擎。
算力是怎样发挥作用的?又将如何影响你我日常的工作生活?近日,记者走进安徽合肥“巢湖明月”新一代算力集群,与建设运营团队在一个个巨型机房里寻找答案。
快速完成海量计算,如何做到?
中国科学技术大学“机器化学家”实验室里,一种新型研究模式让人眼前一亮:这里没有忙前忙后的科研人员,只有一台动作灵活的机器人在操作台之间来回穿梭。
借助它,中科大江俊教授团队仅用5个星期,就从55万种金属配比中找出最优高熵催化剂。而这一过程需要阅读1.6万篇论文、进行2万组理论计算、分析200组全流程机器实验数据。
如此大的计算量是怎样在短时间内完成的呢?答案藏在不远处的合肥先进计算中心。
来到合肥先进计算中心,映入眼帘的是一座巨大的淡蓝色立方体。玻璃立方内,一台名为“巢湖明月”的超级计算机占据着上下4层共计200多平方米的空间。
“这台计算机光服务器就有1500多台,它的计算能力达到了12P,即每秒钟的运算能力为1.2亿亿次。”合肥市大数据资产运营有限公司多元算力服务中心主任张云蕾介绍,“全国14亿多人,每人每秒做一次计算,需要将近100天才能做完1.2亿亿次,而我们这台计算机1秒就能完成。”
“有了这台计算机的支持,我们的‘机器化学家’就拥有了‘超强化学大脑’。”江俊一脸自豪,“它能不知疲倦地执行计算任务,得到最优的实验配方。”
不只是科研领域,当下,算力已经和生产、生活紧密联系在一起。近年来,无论是综合性国家科学中心建设,还是战略性新兴产业发展,合肥都对算力展现出迫切需求。
瞄准这一需求,合肥积极开辟算力新赛道。2021年6月,“巢湖明月”超级计算机正式对外服务。2023年,合肥市大数据资产运营有限公司超前布局,建设了100P级的算力中心,紧接着又与科大讯飞共同建设了3000P级国产万卡算力集群。
“去年,我们又在算力集群上部署了3台量子计算机,探索建立起全国首个量超融合计算中心。”合肥市大数据资产运营有限公司总经理屠冉介绍,眼下,“巢湖明月”新一代算力集群初具雏形。
走全国产技术路线,怎么攻坚?
在中国超级计算机发展史上,有一段受制于人的经历:上世纪80年代,我国从海外高价购置了一台超级计算机,但在使用时却处处受限——为了防止技术泄露,外方要求把设备放在一间全透明的玻璃房里,并控制着机房钥匙和开机密码,我国科学家要经过授权才能进入,且所有操作必须在外方人员的监控下进行。
“‘巢湖明月’玻璃立方的外观设计,就是希望大家不要忘记这段历史。”屠冉告诉记者,最初布局算力集群时,在技术上有两条路线可选:一条是采用非国产芯片,这在当时是技术主流;另一条是走全国产路线。“高新技术是讨不来、要不来的。我们团队经过反复调研分析,最终认定,必须建立自主可控的算力体系,走国产化这条‘难而正确’的路。”
国产化的道路难在哪?首先是接受度问题。屠冉坦言,当时,各类科研团队、客户企业对进口芯片搭建起的算力体系已经形成使用习惯,加之国产算力芯片的性能跟前者相比仍有差距,一开始大家都不太愿意用。其次是技术难度大。想要建设3000P级全国产万卡算力集群,国内尚无成熟经验可借鉴。
“为了啃下这块硬骨头,2023年7月,我们同科大讯飞、华为组建起数百人的联合攻关团队,并把工作计划安排精确到天,实行日报日清制度。”联合攻关团队技术负责人潘青华回忆,组网过程中,单是光纤就有3.5万多根。网络怎么排布?连接后能否跑通?……每一步,对于团队而言都是“摸着石头过河”。
机房改造、设备部署、光纤接入……经过107个昼夜的奋斗,2023年10月,我国首个国产万卡算力集群跑通!张云蕾回忆:“集群点亮的那一刻,不少团队成员流下激动的泪水。”
随后,团队又加紧训练,在2024年1月,国产算力集群性能达到当时同类型进口算力集群的90%。合肥市大数据资产运营有限公司副总经理井梅生介绍,算力集群自运营以来,平均负载率稳定在84.59%,峰值负载率达到91.53%,基本处于饱和运行状态,服务质量得到用户好评。
统筹调度算力资源,效率多高?
江淮汽车股份有限公司研发中心,工作人员利用数字孪生技术模拟汽车碰撞,分析高速碰撞时各个零部件以及假人损伤情况。
这样的试验过去主要依赖实车碰撞,周期比较长。现在依托算力集群先进行仿真实验分析,得到大量相关数据后,再进行实车碰撞验证,相关环节研发周期缩短了30%以上,显著提高了研发效率。
从工业生产到科研探索,算力之所以成为新质生产力,在于它能够赋能千行百业。
新能源汽车、生物医疗、环境监测……驻足“巢湖明月”新一代算力集群展厅,一项项算力赋能产业发展案例令人目不暇接,一个个模拟应用场景及研发产品令人印象深刻。
据了解,自2021年6月对外服务以来,“巢湖明月”新一代算力集群积极服务科技创新、产业发展、民生政务等领域,已累计服务700多家科研院所、近6000个用户,累计交付超34.7亿核时的CPU算力、1.56亿卡时的人工智能算力,保障计算任务超1000万次。
“如今通过与国家超算互联网连接,我们还能调度来自江苏、浙江、上海、四川等14个省份20多家超算和智算中心的算力。”屠冉介绍,去年6月,中国科学院等离子体物理研究所需要峰值约1万核的计算资源,“如果用本地的算力,就要排队等待一个月。我们通过平台调度了外地的算力资源,有效保障任务按时完成。”
今年以来,合肥全力打造国产算力生态高地,升级发布了城市算力池计划,进一步集聚各地国产算力资源。目前,合肥市大数据资产运营有限公司直接纳管的算力已近2万P。
夜幕降临,“巢湖明月”机房里的指示灯还在不停闪烁。玻璃立方亮起,科技创新的步伐继续前行。(本报记者 李俊杰 孙佩瑾)
《人民日报》(2025年04月17日 第 06 版) |