记者丨何己派 编辑丨鄢子为
从呼和浩特市区驱车20公里,一路向南,进入和林格尔新区,中国移动智算中心(呼和浩特),坐落于此。
嗡鸣声中,一排排黑色机柜整齐列队,让算力如同水电,即取即用,沿着纵横的光纤网络,流向AI竞技场。
历经7个多月建设,今年6月底,该智算中心的全部集群正式上线。
“今年中国移动要全面实现‘东数西算’8大枢纽间的高速互联。呼和浩特这一站,开通的是首条400G全光省际骨干网。”中国移动云能力中心智算专家李道通向《21CBR》记者表示。
按规划,该公司将打造万卡级智算集群标杆,今年还将商用哈尔滨自主可控超万卡集群,充分满足大模型集中训练需求。
AI浪潮下,万亿市值的中国移动,由云向算,正布一盘大棋。
天然机房
战略级项目选址呼和浩特,中国移动看上了这里得天独厚的资源、地理优势。
地处北纬40-42度之间,既是大数据产业黄金纬度区,又为京津冀环渤海经济圈腹地。
当地地质结构稳定,自然灾害少,可谓“天上有风光、地下有煤炭、手里有电网”,发电量位居全国第一,且电价低廉,数据中心平均用电价格稳定在0.32元/度,为全国最低。
“这里年平均气温7.7℃左右,全年低于10度的时间,能占50%以上。”
中国移动呼和浩特数据中心工程师孟繁跃介绍道,“天然环境就能给数据中心自然散热,用电成本得以大幅降低。”
“天选之地”呼和浩特,已落地建设十个智算中心,集结包括中国移动在内的一批龙头,于两个月前,拿下“中国云谷”的称号。
孟繁跃表示,团队做过测算,从呼和浩特到北京,“乘坐”400G全光网络,最短只需3.5毫秒,“基本与北京当地时间没有太大差别。”
“焕新”前的中国移动呼和浩特数据中心,肩负东数西算布局中“援京助东”使命。
其既满足京津冀高实时性算力需求,也能为长三角等区域提供非实时算力,于2012年开工建设,2016年投产运营,多年发展下来,总客户数上百家。
在做好通算业务的基础上,顺应AI浪潮,该中心布局智算。
智算项目的建设,总投资46.6亿元,部署8个集群,建设759个机架,智能算力规模高达6.7EFLOPS(每秒670亿亿次浮点运算)。
6.7EFLOPS,什么概念?
与自身对比的话,中国移动呼和浩特数据中心已投产使用9栋机楼,这一单体智算中心的算力规模,比其他8栋楼加起来的算力总和还要多。
系统搭建
“建智算中心,是个复杂的系统工程。”
中国移动呼和浩特数据中心副总经理李程贵提到,相较通算,做智算中心的业务模型估算,难度更大。
他表示,从启动施工到第一阶段的基础设施具备装机条件,用了15周时间,较标准工期缩短一半以上。
工期紧张,又涉及工程管理、设备采购等多环节的协同推进,给团队带来极大挑战。
该中心规模化采用新技术,在基础设施的设计阶段,需要做大量协同规划,亦考验实施阶段的系统稳定性。
例如,在制冷方面,该中心首次大规模引入冷板式液冷方案,配套闭式冷却塔、小母线等新型节能技术,实现PUE降至1.15。
面对初期建设运维时,GPU卡故障频发、网络链路不稳、软件系统缺陷等挑战,中国移动从三个维度下手。
一是打造一套工具,研发自动化智算中心交付体系,实现标准化流程、自动化部署与高效协同作业,提供开箱即用、性能卓越的稳定运行环境,从而提升部署效率与服务质量。
二是搭建一个大平台,通过算网存软硬件智能监控处置平台,对AI训练任务进行全生命周期管理,快速定位问题,确保训练高效稳定进行。
三是组建专业集成调优团队,聚焦数据治理等关键环节,提供全栈服务。
目前,对内,中国移动智算中心(呼和浩特)支撑集团旗下九天大模型的训练,对外,满足行业客户智算业务需求,例如中石油昆仑大模型的训练。
算网雄心
今年,三大运营商不约而同地加码算力网络建设,尤以中国移动的步子迈得最大。
一个明显变化是,其资本支出,由5G向算力倾斜——今年用于5G网络的开支,预计同比减少21%;用于算力的,预计增长21%,达到475亿元。
按其规划,智能算力的增速,将远超通算。
2024年通用算力将新增3 EFLOPS,达到9 EFLOPS;智能算力将新增7 EFLOPS以上,达到17 EFLOPS。
4月,中国移动公示2024年至2025年新型智算中心采购招标公告,此次采购包含AI服务器7994台,中标总金额达到约191亿元,可见其投入AI算力的决心。
“将推动算力网络,加速迈向算网3.0新阶段。”4月的“算力网络大会”上,董事长杨杰强调,中国移动将加快算力网络规模部署和应用。
8月初,杨杰在业绩会上表态,围绕AI,正积极推进“三个万”:投产万卡智算集群,训练万亿级token数据,发布万亿参数大模型。
一系列密集动作,显现出其算网建设的雄心。
它的另一重关键角色,是在打造大模型训练的超级工厂过程中,扩大“朋友圈”,拉着本土厂商伙伴,共同冲刺。
据介绍,中国移动智算中心(呼和浩特)部署2万张AI加速卡,国产化算力占比超85%。
“聚合产业链上下游力量,推动国产算力生态的建设与繁荣,中国移动这样的央企,必须发挥串联、协同、带动作用。”李道通说。
他提到,中国移动已实现昇腾、寒武纪等5类国产化智能算力芯片落地。
底座建好后,中国移动将大干一场。