2024中国计算机大会|青云科技分享DPU智算实践

科技砍柴人 2024-11-03 00:34:00

2024 年中国计算机大会(CNCC)圆满落幕,青云受邀参会并以《借助 DPU 实现算力的灵活调度与管理》为主题,分享了在智算领域的技术创新进展及落地案例,受到参会嘉宾的广泛关注。

作为全国计算机领域知名学术、产业交流盛会,2024 CNCC 围绕“发展新质生产力,计算引领未来”主题展开。大会设置 18 场特邀报告、3 场大会论坛,吸引总计 800 多位国内外专家学者参加。

随着人工智能等技术的飞速发展,对算力的需求呈爆发式增长,如何实现大型异构算力中心的持续运营成为关键挑战。青云科技智算解决方案总监傅帅在演讲中指出,算力基础设施是 AI 发展的基石,青云在智算中心建设中,利用 DPU 技术实现了大型异构算力中心的持续运营,打通了算力形态、网络安全、用户管理、计量计费等关键环节,为智算中心的稳定运行提供了有力支持。

青云基于容器架构、通过 AI 智算平台实现了对多元异构算力的统一管理和调度。从大型的数据中心卡,到消费级 RTX 显卡,再到国产计算卡,青云都能够进行高效的管理和调度。同时青云能够灵活交付私有云、边缘云、分布式云及算力云服务。

而 DPU 作为新型的处理器,能够提高数据中心的整体性能和效率,是青云近一年来进行广泛对接的重要芯片类型,是青云 AI 生态的重要一环。通过 DPU 在裸金属服务中的应用,青云实现了容器调度、节点管理、监控服务等功能的优化,显著提升了裸金属性能和整体系统的可靠性。

同时,青云通过统一算力调度管理集群,实现了对所有计算卡的高效管理,解决了客户在多区域、多计算卡、多产品形式下的算力管理难题。

传统的算力中心在资源购买和配置过程中,涉及到诸多繁琐步骤,如配置资源、网络、公网服务、确定计费模式、签订合同等,青云通过自动化手段将这些步骤大大简化,降低了用户的工作负担。青云 AI 智算平台运营计量与计费系统提供了全量运营计费计量功能,实现了租户隔离和灵活定价。用户可以根据自己的需求和预算选择合适的算力资源和服务,并按照实际使用情况进行计费。

目前,青云已经参与遍布全国、近 30 家区域智算中心的建设与运营,单个智算中心的最大规模超过 3000P、总算力规模超过 10000P,管理着超过 12000 张计算卡。

青云科技将不断探索智算领域的新技术、新应用,为客户提供更加优质的产品和服务,为推动我国计算机技术及产业的发展做出积极贡献。

0 阅读:0

科技砍柴人

简介:感谢大家的关注