今天 DeepSeek 开源的新项目叫 DeepEP。
简单说就是大幅度提升 MoE 即混合专家模型中,专家之间沟通和交流效率的。
还是基于英伟达集群和 cuda 的。
但是,说实话从 DeepSeek 开源的东西看,他们已经非常深入 cuda 核心了。老黄有理由高兴,也有理由担忧。[汗]
今天 DeepSeek 开源的新项目叫 DeepEP。
简单说就是大幅度提升 MoE 即混合专家模型中,专家之间沟通和交流效率的。
还是基于英伟达集群和 cuda 的。
但是,说实话从 DeepSeek 开源的东西看,他们已经非常深入 cuda 核心了。老黄有理由高兴,也有理由担忧。[汗]
热门分类
科技TOP
科技最新文章