光模块观点更新:周末光模块板块关注度持续提升

南风之神说 2024-06-19 16:25:37
对于市场较为关注的几个问题,我们的思考如下: ①为何今年以太网在AI集群中的“出镜率”变得很高? A:这主要由GPU的负载变化所驱动。2023年IB网络独占鳌头,这主要因当时云厂商搭建的GPU集群以【自用】为主;而今年起或逐步向【自用+向用户租用】的模式转变。在该趋势下,将GPU资源进行灵活的动态调配变得很重要,以太网架构相比IB更适用于该场景,这也或是英伟达在今年主动拥抱以太网架构的核心原因之一。 ②为何推理端也会有800G光模块需求? A:市场普遍担忧AI推理对于高速光模块需求或较训练侧放缓。而我们认为随着视频生成等应用的涌现,网络带宽的要求较文生文显著提升;另一方面,随着GPU集群更多的面向外部用户租用,用户侧对训练与推理的使用较难提前规划,故云厂商或仍倾向按照训练的架构进行组网(训推一体),该架构下GPU集群仍保持对高速光模块的饱满需求。 ③还有哪些市场忽视的因素? A:GPU集群规模仍在迅速扩张,我们认为这一点对理解光模块需求的持续性较为关键。2023年GPU集群规模普遍在5万卡以内,随着大模型参数量的持续攀升,以及推理需求的显现,今年有望出现十万卡集群,百万卡集群也已在头部厂商的规划之中。我们判断届时可能会通过增加交换机端口数以保持三层网络架构(英伟达),或可能进一步增加网络层数以满足超大集群互联需求(Marvell说法),从而带来GPU与光模块配比的进一步提升。 投资建议:我们在春节后第一时间发布深度报告《光模块:时代的跨越,从云计算迈向AI》,其中明确提出:在缩放定律的指引下,各厂商对于大模型训练侧的投入强度仍将保持提升,而不是市场所担忧的24/25年见顶;另一方面,随着GPU迭代周期的缩短,光模块升级步伐预计提速,在此背景下头部厂商地位预计稳固。站在当前时间点,我们仍看好板块配置机会。
0 阅读:0

南风之神说

简介:感谢大家的关注