一横五纵,联想为算力提质

作者: CBINEWS

责任编辑: 邹大斌

来源: 电脑商情在线

时间: 2024-08-26 16:39

关键字: AI 联想 智算

近年来,我国数字经济产业规模持续增长。统计显示,2023年数字经济规模已经超过55万亿元人民币,占GDP 43%,这表明数字经济已成为我国经济高质量发展的新引擎。在这一过程中,算力作为数字经济的关键基础设施和新质生产力的基础保障,其重要性日益凸显。与此同时,数字经济的发展,尤其是人工智能的大规模应用,也对算力提出新的需求,构建高性能、易扩展且低碳的算力基础设施成为支撑人工智能创新和数字经济发展的关键。响应新的市场变化,联想推出万全智算平台和“一横五纵”的布局,以及覆盖通用、AI和科学计算等场景的众多解决方案,以加速人工智能应用的落地,助力数字经济的发展。

AI时代需要新算力

近年来,算力基础设施市场最引入关注的无疑是生成式人工智能。随着生成式AI应用的日益普及,现有算力基础设施的不足日益凸显,对算力进行升级和提质成为越来越普遍的需求。

“算力经济”概念的提出者、长期从事算力相关研究的第十四届全国政协委员、中国科学院计算技术研究所研究员张云泉总结了当下算力基础设施领域的三大趋势:算力服务兴起,算力与算力服务快速发展;超算与AI融合创新,智算中心进入新基建;AGI时代来临,催生出MaaS商业模式。

实际上,对于这些变化业内人士或多或少都有所感受。比如,很多地方都在上马智算中心建设项目。张云泉表示,“生成式AI需要大模型,大模型的训练需要大量的GPU卡,可能要上万张卡甚至10万张卡,而传统的数据中心和超算中心都不具备,这些需求推动了智算中心的建设热潮。”

今天智算中心已经进入新基建的范畴,国家也在引导智算中心的建设。相比传统中心和超算中心,智算中心有自己的特点。比如,智算中心不仅算力规模大以支持复杂的模型训练和推理过程,还强调算力的高效性、灵活性和可持续性,绿色环保要求也更高。

以能效为例。过去的数据中心机架设计功率只有3千瓦、5千瓦,现在一台服务器就要超过这个设计值,高的甚至超过10千瓦。而且,对PUE要求也再提高,现在很多地方政府已经限制在1.4以下。这无疑对智算中心的制冷能力提出了很高的要求。

同样,资源的调度也成为智算中心的关键问题。众所周知,生成式AI应用需要大量GPU,异构计算成为标配。而另一方面,很多公司过去已经投资了高性能计算,已经有部分GPU的算力资源,如今为了生成式AI又投资了GPU算力,这两套系统并不相通,造成了不少浪费。

“超算中心是最早部署GPU的,拥有管理和运维GPU的经验,超算中心的这些经验完全可以应用到智算中心,比如GPU的调度、容错、功耗控制等,同时,随着生成式AI的成功需要将这些算力利用起来。”张云泉表示。

一横五纵布局新算力,助力超智融合

作为基础设施供应商,联想自然也感受到市场的最新变化和需求。联想中国基础设施业务群战略总监黄山介绍,结合联想自身的业务特点,联想重点关注以下四个方面:

1. 国产算力。国产算力是国家战略的需要,将会承担越来越多的主流计算任务,在此背景之下,联想需要与国产生态进行对接,支持国产算力的发展。

2. 液冷。由于AI的普及,服务器的功耗大幅增加,机架内热密度越来越高,对数据中心的制冷能力构成极大的挑战,从风冷转向液冷势在必行。

3. 交付方式。在超算、智算融合的背景下,算力的交付趋于多元化,私有云、公有云、混合云、订阅服务等各种交付形式都需要支持。

4. 全球客户和中国客户都需要支持。这两个市场有着各自不同的特点,需要不一样的支持。

为了更好地落实上述四个业务重点,联想推出了“一横五纵”的业务布局。“一横五纵”中的“一横”指的是联想万全异构智算平台,而“五纵”则是指服务器、存储、网络、超融合软件以及各种边缘设备。

这里的联想万全异构智算平台是整个业务布局的关键,它负责实现所有服务器、存储等所有“五纵”设备的拉通。“联想万全智算平台对下要管理硬件,要将AI芯片核心软件进行整合;对上和工具链、大模型调优对接。具体而言,它要完成异构算力的管理调度、集群系统的容错与任务的监控、故障监控、资源监控、集中的运维与运营管理以及与云的对接等。”黄山介绍。

简单来说,联想万全智算平台有两大核心功能,即异构算力的统一纳管和提升整个系统的计算效率。

以最耗资源的大模型训练为例。在模型训练时有两大挑战,一个是网络的瓶颈。另一个是故障恢复。对于前者,万全智算平台具有拓扑感知能力,结合多年积累下来的集合通信算法库,可以重新规划最短传输路径,以避免网络拥塞。对于后者,万全智算平台可以利用AI能力去预判故障的发生,结合监控、存储以及调度等能力将断点恢复从数小时级变成分钟级。

黄山表示,联想之所以能做万全智算平台也是因为联想在超算和智算者两个领域都有多年的技术积累,有能力把这个两个系统的调度融合,把“两套变一套”。

实施双品牌战略,支持国产算力生态

在联想的“五纵”布局中,服务器是非常重要的支撑。截至目前,联想已经成为非常完成地覆盖通用计算、智慧计算和科学计算全场景的产品阵列。

“联想在设计整个服务器的时候,我们一直秉承的是更好的性能、更低的能效、更高可用的理念。”联想中国基础设施业务群服务器产品部总经理周韬表示。

具体而言,在性能方面,联想会采用更高性能的算力芯片、高扩展、高IO的互联,来实现整个服务器的性能更高。在能效方面,联想有十几年的海神温水水冷技术,已经应用在了最新的服务器上,来降低整个数据中心的PUE。而在高可用方面,联想的服务器有2万多项的从元器件到整机的测试保证,还有基于AI的智能预警和故障判断的加持。

尤为值得一提的是,在服务器产品上,联想从去年开始推出了双品牌战略,在原来的ThinkSystem品牌之外新增了一个专门面向中国市场的联想问天品牌。

周韬说介绍,ThinkSystem品牌是一个在全球销售的品牌,符合全球标准和认证,可以在全球享受当地的保修服务。而联想问天是专门为中国市场推出的,能更好地支持中国的生态,比如国产网卡、SSD、操作系统等。

周韬说透露,作为联想双品牌战略的落地举措之一,联想近期将发布了一款新的问天系列服务器,即首款搭载AMD最新处理器的联想问天WR5225 G3。这一款服务器采用全新的AMD EPYC第四代处理其,最高可以支持256个CPU内核,支持3个双宽GPU,整机可以支持到24个内存槽。在高可靠性方面,“双子星”BMC去耦设计和“神盾”防过载系统等技术,将进一步帮助客户减少停机时间,并可实现无中断固件升级,为客户系统稳定持续运行保驾护航。

得益于联想在服务器产品的不断深耕,联想服务器市场份额迅速上升。根据IDC不久前发布的《2024年第一季度中国x86服务器市场报告》,在中国市场联想服务器市占率已经进入前三,跻身第一阵营。不久前,刚刚发布的联想2024/2025财年第一季度财报显示,包括联想服务器业务在内ISG部门再创佳绩,实现了65%的增长。种种成绩充分表明联想在算力市场的业务布局正在显现成果,这也让我们更佳期待联想能给中国市场带来更多更为优秀的产品、技术以及先进的理念,为中国新质生产力注入更多动力。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255