作者:毛烁
“新质生产力”的脉动催化着人工智能的潜能,激荡出算力服务的浪潮、激发出AI应用的光芒——这些当下最炽热的话题,在此交织出“算力时代”学术层面的饕餮盛宴。这是中国最具影响力的高性能计算领域专业学术盛会——第 20 届 CCF 全国高性能计算学术年会(以下简称“CCF HPC China 2024”)的现场。
2024 年 9 月 24 日至 26 日,由中国计算机学会主办,中国计算机学会高性能计算专业委员会、华中科技大学、上海交通大学承办,中国地质大学(武汉)、北京并行科技股份有限公司协办的“CCF HPC China 2024”,在湖北武汉隆重开幕。
作为与“德国ISC”和“美国SC”并驾齐驱的世界三大超算盛会之一,“CCF HPC China 2024”以其深厚的学术积累和国际影响力,再一次证明了其在全球高性能计算领域的领导地位。
随着“CCF HPC China 2024”序幕拉开,各界专家、学者纷纷云集,共同探讨高性能计算技术的未来。24日开幕式和主论坛,盛况空前,在12位中外院士的领衔下,持续一整天的会议,在全球顶尖专家的分享和精彩纷呈的展览中,展现出卓越的学术深度和广泛的行业影响力。
大会第二天,随着“CCF HPC China 2024”会议的序幕渐展,精彩的讨论与交流持续升温,未见丝毫减退之势。在这一全球瞩目的科技盛会上,高性能计算领域的顶尖专家和学者以卓越的见解和深邃的学术洞察,引领着一场场分享和讨论向着更高的学术峰巅迈进。
智算创新——AI驱动高性能计算多维度创新发展
25日的会议中,一系列精彩的主题分享突出了高性能计算在不同领域的关键作用,从生命科学到大数据处理,再从稀疏矩阵计算和智能汽车的设计优化,演讲专家深入探讨剖析了高性能计算如何塑造未来产业。
在研究高性能计算时,不得不提及如何将这些算力更广泛地赋能在应用中。扎克伯格说:“有了 Llama 3,全世界就能拥有最智能的AI。”今年以来,开源大模型Llama3的性能实现了重大飞跃,其4000亿的参数性能直逼GPT-4。事实上,Llama3的超高性能得益于Meta庞大的基础设施,包括高性能服务器和先进的数据处理中心,使其能够高效处理大规模数据和复杂计算任务。“Llama3在内容生成方面的演进和进展,来源于高质量、高容量的数据和深度学习支持,Llama3使用了15T token的数据集,比Llama2增长了7倍。同时,其使用了公开可用的在线数据源。”Meta平台部门研究科学家兼技术负责人Pavan Balaji如是说。
Meta平台部门研究科学家兼技术负责人 Pavan Balaji
HPC已经在众多行业领域中发挥着重要作用。然而,HPC资源的高效应用和普及仍面临挑战,包括资源分布不均、访问复杂性以及运算成本高昂等问题。通过构建更加开放和互联的超算网络,可以有效克服现有挑战。国家高性能计算机工程技术研究中心副主任曹振南强调,通过网络连接全国已经建成的超算中心、智算中心,形成统一的应用环境,培育用户的使用习惯,降低使用门槛,提高超算资源的应用水平是现阶段发展的重点。
国家高性能计算机工程技术研究中心 副主任 曹振南
在生命科学领域中,对于大规模数据进行高效处理,是推动研究进展的关键。随着高通量实验技术的进步,推动了海量生命科学数据的增长,传统的数据分析工具已无法满足当前的需求,这促使科学家们寻求更强大的计算资源。高性能计算(HPC)集群因其处理复杂计算任务的能力而成为研究中不可或缺的工具。北京大学高级工程师,昌平实验室高级研究员孔雷表示,生命科学计算需求的市场规模每6年翻一倍,生命科学研究越来越依赖数据驱动,计算能力也已经成为生命科学研究的核心竞争力。利用面向实践的生命科学高性能集群性能评测及分析框架,可有效提升该领域的计算效率。
北京大学高级工程师,昌平实验室高级研究员 孔雷
AI时代,计算速度的提升已成为提高企业竞争力的关键。据IDC报告显示,全球数据量预计将从2020年的44ZB增长到2025年的175ZB。面对这样的数据浪潮,有效的计算加速不仅能够大幅提升数据处理效率,还能缩短决策时间,加快产品上市速度。在俄罗斯科学院院士,俄罗斯科学院马尔丘克数值数学研究所所长Eugene Tyrtyshnikov认为,想要使计算更快,需要提高超级计算机的功率,并改进现有算法使其适应新的计算架构。同时,可适当寻求低参数的数据模型,以及使用小参数集实现高效工作。
俄罗斯科学院院士,
俄罗斯科学院马尔丘克数值数学研究所所长Eugene Tyrtyshnikov
正如数据量的增长推动了对高速计算的需求,类似地,在稀疏矩阵计算的进展也对并行处理技术提出了新的挑战和机遇。稀疏矩阵存在于很多科学与工程计算问题之中。在过去几十年间,研究人员一直在寻找更快的并行稀疏矩阵算法。而随着大规模并行处理器的出现,更是给稀疏矩阵计算的研究带来了关于可扩展性、性能和实用性的挑战,中国石油大学(北京)教授刘伟峰坦言,在稀疏矩阵计算领域,我们面临着形状规则化、负载均衡、和依赖规律化等关键性能挑战。优化这些方面不仅能提升计算效率,还能增强整体算法的应用广度和深度。实际上,将高性能转化为高实用性,需要我们在数据结构和算法设计上进行深入研究和创新。
中国石油大学(北京)教授 刘伟峰
随着人工智能技术的飞速发展,AI加速计算已成为推动高性能计算(HPC)进步的关键工具。市场研究机构Marketsand Markets的报告显示,全球AI加速器市场预计将从2020年的13.6亿美元增长到2025年的70亿美元。这一增长主要来自深度学习和机器学习需求的推动,这些技术需要处理大量的矩阵计算。微软亚洲研究院研究员李琨介绍了有关高性能计算演变范式的案例,以及关于MatrixScience的案例研究。针对高性能计算,李琨分享了三个启示。其一是,简化工作,更好利用现有的数据库。其二是,通过统一操作,帮助HPC工作负载实现更好性能。其三是,让HPC工作负载也“享受”到AI加速。
微软亚洲研究院研究员 李琨
随着AI模型规模的急剧扩大,适用于超大规模训练的算力资源供给不足已成为制约行业发展的瓶颈。北京北龙超级云计算有限责任公司总经理吴迪强调,面对这一挑战,北京超算提出了“超智融合全景算力服务”的创新理念,致力于为客户提供高质量、高性价比的超算架构大模型算力解决方案。她表示,北京超算凭借丰富的算力资源池、基于超算架构的高性能基础设施、智能化的资源调度与性能优化、灵活的使用模式与高性价比,以及全方位的技术支持服务,成功为多家知名AI企业和科研机构提供了算力支持。
北京北龙超级云计算有限责任公司总经理 吴迪
随着新能源汽车进入智能化时代,车辆本身复杂性,以及用户场景显著增加,传统的CAE已难以满足快速发展的需求。因此,构建强大的算力,来开拓CAE应用场景,提升CAE仿真能力和效率,是提升车辆性能的关键。通过实现更高效的,更全面和更复杂仿真系统,未来智能汽车的CAE不仅能够提高设计精度和产品质量,还能缩短新车型的研发周期。在赛力斯汽车整车技术平台总监石荡赫看来,在HPC及AI时代,汽车CAE领域呈现三种发展趋势。其一是,仿真工况趋于用户实际的用车场景。其二是,大规模仿真得以在工程开发中应用。其三是,多学科协同优化仿真得以开展。
赛力斯汽车整车技术平台 总监 石荡赫
高质量成果——“CCF HPC China2024超算年度最佳应用”入围报告
在此次CCF HPC China 2024年会上,进行了四场“CCF HPC China2024超算年度最佳应用”入围报告。
值得注意的是,入围“CCF HPC China2024超算年度最佳应用”的团队中,不仅有来自业界的学术专家,也有众多青年学者脱颖而出。据悉,本年度的最佳应用特别鼓励青年学者积极参与,旨在激励拓宽青年学者创新研究边界,为促进产学研合作,积极构建高性能计算领域高水平科技创新研究体系,培育“新生动力”。
会间,四场精彩纷呈的入围报告展现了基于“神威”和“天河”高性能计算,实现在生物化学、气候模拟、核聚变等方面的科研创新与应用突破。
在现代科学研究中,拉曼光谱技术因其能详细揭示物质的化学组成与结构特征而被广泛应用于生物化学领域。尽管拉曼光谱在诸多研究领域展现出巨大潜力,但其在大型生物分子体系中的应用却因高精度量子化学模拟所需的巨大计算和存储资源而面临技术挑战。中国科学院计算技术研究所高级工程师刘颖博士介绍了一种革新的高效拉曼光谱计算方法,该方法采用ab initio精度,通过“分而治之”的策略,将大型分子体系细分为更小的单元,再将这些小体系的运算编排为可进行异构加速的计算任务。她透露,该技术已经在国产超算系统“神威”与“东方”上得到应用,成功实现了超大型生物体系的拉曼光谱模拟,且在整个系统上展现了近线性的加速比。
中国科学院计算技术研究所高级工程师 刘颖
在全球气候变化研究中,精确模拟海洋多尺度交互过程一直是技术上的巨大挑战。这一过程中,对于理解气候系统至关重要,需要极高的计算能力才能进行详细分析。崂山实验室研究员,博士生导师刘海龙坦言,LICOMK++的全球海洋通用环流模型可以有效解决这一问题。他介绍说,这一模型能在不同的超级计算机平台上,实现最高水平分辨率全球1 km天气尺度真实海洋环流模拟,成功地解析了海洋中的中尺度和亚中尺度过程。“全球1km的LICOMK++模式在新神威和东方超算可扩展到全机,计算速度超过1SYPD,并行效率超过50%,各项指标均超过SOTA水平。”刘海龙透露。
崂山实验室研究员,博士生导师 刘海龙
同样的,为了应对全球气候变化导致极端天气事件频发,准确预测灾难事件,减轻灾害影响。山东大学软件学院研究员段晓晖强调说:“我们在超级计算机上实现了GRIST模型的显著优化,引入人工智能增强的物理过程、OpenMP并行技术和混合精度方法,大幅提升了模型的运算效率和性能可移植性,使模型能在更广泛的硬件平台上运行。在最新的实验中,成功模拟了台风“杜苏芮”引发的723特大暴雨关键现象,实现了在1公里分辨率下的高精度模拟。”
“这种技术进步使我们的模型能够扩展到3400万核,每天在3公里分辨率下进行491模式天、1公里分辨率下进行181模式天的高效模拟,对预测和准备应对未来极端天气事件具有重要意义。”段晓晖如是说。
山东大学软件学院研究员 段晓晖
激光等离子体相互作用是惯性约束核聚变核心技术之一,对提高核聚变效率具有至关重要的作用。针对这一复杂过程的模拟,国防科技大学博士生李彪团队在天河新一代超级计算机上成功开发了YHPIC程序。李彪介绍说:“这是一款完全并行的三维粒子模拟(PIC)程序。YHPIC集成了有限时域差分、数值色散自由场求解器、Boris粒子推进器等高级功能,专为天河新一代超算体系结构优化。YHPIC可实现在102400个计算节点上,对42.9万亿粒子和104亿网格进行了模拟,重现了惯性约束聚变实验中由激光驱动的腔内激光等离子体不稳定性过程。李彪强调,该模拟实现了超过42.5 PFLOP/s的持续性能,其计算能力和可扩展性,为未来核聚变能源的开发贡献了技术助力。
国防科技大学博士生 李彪
写在最后
25日的会议在专家与听众的热烈讨论交流中圆满结束。据了解,本次“CCF HPC China 2024”大会规模空前,同期举办了30场主题论坛,以及30余场丰富多彩的周边活动,大会参会人数首次突破4000人,再创新高。
有参会者评价称,本次大会极大地促进了与会者之间的互动学习,成功地搭建了一个共同探讨高性能计算技术最新研究成果和创新应用的平台。会议通过分享行业发展趋势和实践经验,有效地加深了产学研各界的交流与合作。这种深度的互动和合作为推动中国高性能计算技术与应用的发展提供了宝贵的智力支持,展示了集体智慧的巨大力量。
活动期间,更多与会者也纷纷表示,本次大会站位高、格局大、干货足、互动强,精彩纷呈的议题、全球顶尖的嘉宾阵容、高质量的论坛内容结构,为充分繁荣高性能计算产业生态,加快形成知识和技术的深度协同范式,进一步加速发展新质生产力,提供了专业型、开放型的高水准生态平台和信息中枢。