我觉得本周 DeepSeek 一系列的开源项目,正在把 AGI 的进程带入正轨。
加速算力集群的提供商,就应该比拼的是性能和价格。
而加速算力的集成服务商,就应该提供的是弹性和高效的管理。
在此基础之上,模型训练公司和模型服务公司最终利用高弹性的算力,通过开源中间件,跨集群得灵活而且便宜的加速算力。
这本来就是互联网时代的成功经验。在过去40年,这套分工疯狂地推动了互联网和移动互联网的高速发展。
最终获益的不是某两个公司,而是全球无数家的公司,从英特尔到苹果,从 github 到小米,从 linux 到 阿里云。
cuda 和英伟达集群的绑定,以及 open ai 的闭源其实无法达成这种效率。直到 DeepSeek 这几个开源中间件发布之后,这个三级架构正在成为可能。
向下,虽然这些中间件基本都有 cuda 依赖,但是思想才是开源真正的价值。
所以,另一个中国加速算力供应商,摩尔线程,也接入了 deepGEMM 和 flashMLA。
而向上,阿里巴巴似乎也看清了趋势,宣布投入 3800 亿做加速算力平台,提供 ai 时代的水电煤。
我不管美国英伟达和 open ai 最终闭源封锁一切利润的方式是否靠谱,我只知道如果中国摩尔线程(还有华为)提供加速算力,DeepSeek 提供开源中间件和基础模型, 阿里云提供加速算力的弹性的云供给。。。
那么中国的平台更可能惠及所有人。也更可能发展出蓬勃的 ai 应用生态。