今年7月,百度Apollo旗下自动驾驶出行服务平台“萝卜快跑”进入了公众视野,在无数媒体上“刷屏”,这一基于Apollo ADF大模型的无人出行服务一经推出就引起了热议。无论人们如何看待这些穿行在武汉街头、不知疲倦地运转着的“螺丝钉”,他们都必须承认,大模型赋能的AI正加速到来并深刻地融入到社会、生活的方方面面,属于AI的新时代方兴未艾。
而在这一轮AI浪潮中,与工业时代的化石燃料,如石油、煤炭相对应的数字时代的算力已经成为AI发展的重要底座。第十四届全国政协委员、中国科学院计算技术研究所研究员张云泉指出:“如今,我国已经进入算力经济时代,算力服务异军突起。每在算力领域投入1元,就将带来3-4元的经济产出;算力发展指数每提高1点,GDP增长约1293亿元。”
“一横五纵” 逐鹿数字时代
当前,AI技术发展日新月异,大模型百花齐放。通过智能算力的高质量发展主力AI领域创新,并进一步构筑新质生产力已成为重点。作为领先的智能基础设施提供商,面向AI基础设施,联想已构建了“一横五纵”的战略布局:通过“一横”——联想万全异构智算平台,打造服务器、存储、数据网络、软件及超融合、边缘计算“五纵”产品能力,为客户提供高效稳定、绿色节能,且覆盖通用、AI、科学算力的全场景产品方案。
日前,以“以‘算’提‘质’,蓄能未来”为主题的2024年第六期联想新质媒体沙龙正式举办,多名专家学者和媒体代表聚焦AI基础设施的创新与发展,深入交流了算力产业趋势和最佳实践,共同探讨未来的大模型时代算力发展新图景。在沙龙现场,联想中国基础设施业务群服务器产品部总经理周韬还透露,首款搭载AMD最新处理器的联想问天WR5225 G3高性能机架式服务器即将正式发布,该产品发布不仅丰富了联想“一横五纵”的业务战略版图,也进一步满足了千行百业对于算力多样化、高性能、高扩展性的需求。
释放模型效能 承接算力需求
随着生成式AI技术的高速发展,算力越来越成为数字经济社会发展的重要底座:在技术层面,超算、云计算、大数据等与AI的融合创新,不断推动算力需求增长;在实际应用层面,世界上TOP100异构计算超级计算机的算力服务份额不断攀升,加速推动算力服务业的高效发展。
第十四届全国政协委员、中国科学院计算技术研究所研究员张云泉指出,算力经济是以计算为核心的、数字经济衍生的一种新经济形态,在他看来,算力已经成为衡量一个地方数字经济发展程度的代表性指标,是实现新旧动能转换的主要手段。而AI对于算力的需求将会超过其他领域对于基础算力的需求。“超算与AI融合创新,智算中心列入新基建,大模型带来了新的计算需求。未来的算力需求主要来自大模型、自动驾驶、短视频等应用场景。”张云泉预判了未来算力发展的趋势。
第十四届全国政协委员、中国科学院计算技术研究所研究员 张云泉
面对GPT大模型兴起,AGI时代来临之际,张云泉还强调了MAAS商业模式(的影响,他认为,MAAS将会对传统的软件开发、服务部署产生深远影响——IaaS、SaaS、PaaS三层架构可能会插入MaaS层。“我们普及需要类似电力插座一样的算力插座,以此来赋能算力经济发展,而当下的大模型就扮演了算力插座的角色。放眼未来,在新能源发达地区也会出现类似发电厂的算力工厂。”张云泉说。
筑牢数字基座 助推算力融创
在目前的中国市场中,国际与本土的算力资源均受到高度重视。国际算力已步入相对平稳的发展阶段,而国产算力则逐步承担起了日益增多的主流计算任务,国产算力的迅猛发展不仅是国家发展的迫切需求,更预示着其将步入增长的黄金时期。
国产算力生态领域内呈现出群雄逐鹿、竞相发展的繁荣景象。在此背景下,联想中国基础设施业务群战略总监黄山分享了联想在算力领域的布局:“我们已经进行了全面的算力布局,如横向提供完善的基础设施产品组合,包括服务器,存储,网络,超融合,边缘计算,可纳管CPU、GPU、DPU等异构算力芯片协同计算,统一管理通用计算、科学计算、智能计算等异构计算集群;纵向实现了云边端算力协同,如在智算领域提供从云上训练、训推和推理,到边缘训推、推理再到端侧智能的全场景算力支持。”
联想中国基础设施业务群战略总监 黄山
此外,黄山还介绍了联想在其他方向上的布局:“我们致力于助力中国AI核心技术生态发展,研发了全球领先的液冷技术,并开创了多元的算力部署和交付方式。此外,我们还通过联想问天系列基础设施产品支撑国内算力应用的需求,通过联想ThinkSystem国际产品助力中国用户在国际拓展业务。”
而在联想“一横五纵”的战略的“一横”,也就是联想万全异构智算平台方面,联想融合了算力匹配魔方、GPU内核态虚拟化、集合通信算法库、AI高效断点续训技术、AI与HPC集群超级调度器五大创新技术,能够帮助客户轻松获得融合、稳定的AI基础设施,满足不同场景高效、稳定、多元的算力需求,统一纳管异构算力,释放AI基础设施生产力。“这一平台自2023年4月份发布后就获得大量关注,并迅速应用于各行各业场景中。如在某高校科研场景中,联想万全异构资产平台能够统一管理HPC(高性能计算)资源池和AI资源池,并接入通用计算资源池,形成统一的算力管理界面,实现资源的共享和融合调度,大幅提高了资源的使用效率,并简化用户的管理流程。”黄山介绍道。
截至目前,联想万全异构智算平台目前已经获得了北大生命科学学院、紫金云等众多行业客户的认可,即将助力西北地区较大的公共算力平台紫金云成功实现多元算力的异构纳管。平台中的HPC(高性能计算)和AI统一管理和运营服务,不仅支撑了科学计算、工程计算等传统HPC的算力需求,也能够满足大模型研发和探索的算力需求。
“三高一低” “创变”AI基础设施
这些年,中国算力产业实现了爆发式增长。有数据显示,2023年我国算力总规模达到每秒1.97万亿亿次浮点运算,位居全球第二。这一成就得益于算力基础设施建设的加速提质,并向智能算力布局。“过去几年,中国智能算力规模正以56%的复合增长率在迅猛增长。中国算力市场无处不智能,AI已经渗透到日常生活的方方面面。”联想中国基础设施业务群服务器产品部总经理周韬表示。
联想中国基础设施业务群服务器产品部总经理 周韬
为满足各行各业对于智能算力的需求,联想不断丰富智能算力领域的创新应用。周韬强调:“为进一步满足千行百业对于算力多样化、高性能、高扩展性的需求,首款搭载AMD最新处理器的联想问天WR5225 G3即将正式发布。该款全新的服务器秉承了联想服务器一以贯之的“三高一低”——高性能、高可靠性、高扩展性、低能耗特性。”
在高性能方面,借助全新的AMD EPYC第四代处理器,联想问天WR5225 G3单处理器核数增加了100%,提升了2.8倍性能,并支持AMD下一代平台;在高可靠性方面,“双子星”BMC去耦设计和“神盾”防过载系统等技术,将进一步主力客户减少停机时间,能够实现无中断固件升级,为客户系统的稳定、持续运行保驾护航;在高扩展性方面,联想问天WR5225 G3的“百变互联” 模式可以实现的灵活XGMI高速互联,以适应客户不同场景、不同使用周期的应用需求,同时,DDR5内存以及PCIe Gen5的深度应用也为带宽带来了质的飞跃,此外,12个PCIe插槽的设计为客户提供了无与伦比的IO性能。
在低能耗方面,服务器可实现CPU、DIMM、VR、GPU的液冷全覆盖。在,“百变精硅”内存液冷模组中,创新的软硅导热材料精确到了0.01毫米的厚度,恰到好处地保证了液冷模组与内存的充分接触和热传导效果,同时又确保在插拔安装过程中不会损伤内存。而采用仿生技术设计的“羊角”EVAC散热器和“龙卷风”智能风道电源散热控制系统等技术的使用,进一步降低了整机的能耗,提升了能效比。
“联想问天WR5225 G3为我们服务器阵营又添‘一员大将’。事实上,联想服务器近几个季度增长迅猛,今年第一季度跃升至中国市场第三位,销售额同比、环比增速在前十厂商中均居第一。此外,联想服务器在众多垂直行业的表现也是可圈可点,全面覆盖了头部互联网企业,在运营商市场斩获了多个大单,制造业市场份额已于2023年第三季度跃居前三,在教育市场,我们也以众多的HPC灯塔案例领跑第一阵营。”周韬回顾道。
大模型浪潮滚滚而来,算力带来的全新生产生活方式正加速渗透千行百业,呈现出了以算力技术创新共筑新质生产力的生动图景。在AI浪潮中,联想将持续聚焦智能算力领域,为AI发展赋能,聚力开启AI基础设施新篇章,释放AI时代发展新动能。