DS一周开源启示录:又一次颠覆式的创新,推理框架优化全面利好AlAgent!看好云&国产算力中期维度有望全面加速【天风计算机缪欣君团队]
1、Deepseek一周开源了五个项目,最大看点在 Infra层极致优化带来机制推理效率
上周Deepseek开源了FlashMLA、DeepEP、
DeepGEMM、并行优化策略和Fire-Flyer文件系统和Smallpond,针对英伟达芯片从注意力机制、通信库、矩阵计算库、并行优化策略和训练推理的数据存储管理等方面全面优化和压榨。同时公布了自家V3/R1模型的推理系统,在大规模跨节点专家并行、计算与通信并行处理和智能负载均衡的优化下,其在线服务性能得到极大的优化,证明Deepseek在低成本的API价格下依然能够盈利且可能利润率不低。
2、质变的创新,极致的Infra工程能力并开源有望加快全社会大模型推理效率数倍
不同于以往的基于VLLM和SGlang等开源框架的修改的推理框架(大概满血版R1每百万token的成本约150元),deepseek的成本约3.8元,当然考虑到冗余、机器使用效率和公布的token消耗中V3/R1的比例,我们认为实际成本可能要更高 详情可私信,但实际推理成本仍然是下降数倍。
我们认为开源后全社会都会积极学习和应用DS的推理框架,这有望大大降低模型应用调用API的成本, 增加其ROI 全面利好应用。
3、算力短期或有分歧,但Jevons悖论历史经验表明中期维度有望全面利好
我们认为这次开源从中期维度上看是全面利好应用以及应用背后的推理算力的。按照字节当前6万亿tokens/天的消耗,即使按照DS极致的性能,在不考虑任何冗余和机器利用率的问题下,按照DS 一天1680亿token的消耗和1814张 H800的支撑, 也需要约6万+张H800才能支撑,考虑到今年大模型tokens消耗有望快速增长的目标,我们认为中期对推理和应用并不利空。同时考虑到未来更进一步的国际大环境,国产推理算力面临的机会更大。
投资机会建议关注
一国产算力计算机双王、昇腾链,公有/私有云如深信服+智微、阿里巴巴、三大运营商、腾讯
一Al Agnet:金山办公、金蝶国际、汉得信息、同花顺、泛微网络、鼎捷数智、博思软件、用友网络、新致软件、星环科技、迈富时、万兴科技等