图片来自摄图网
10月16日,白宫一纸GPU禁令,英伟达即将“退场”。行业本以为还有“最后30天操作窗口期”,却突然被美国政府通知“出口管制规则”在10月23日立即生效,这意味着大量需要英伟达芯片的中国公司只能选择替代路线,批量采购国产AI芯片。那么,谁将最有机会杀出重围,扛起成为“中国英伟达”的历史使命呢?
在这里就要提到刚刚被美国列入“实体清单”的全功能GPU初创公司——摩尔线程,由原英伟达全球副总裁、中国区总经理张建中2020年创立。摩尔线程成立仅3年时间,就量产了苏堤、春晓、曲院三颗全功能GPU芯片,其中第一颗芯片苏堤从设计到量产仅用了18个月。并且据企查查显示摩尔线程至今已有300多件发明专利,在国内GPU企业中排名第一,包括了GPU人工智能计算核心IP、GPU多核心调度IP、GPU芯片内部通讯总线IP和GPU片间互联,有望实现全国产自研。
摩尔线程还是国产第一家消费级游戏显卡公司,在经过9次驱动升级后,MTT S80已经能流畅运行DX11游戏,并且据外媒曝光,摩尔线程已经在研发下一代游戏显卡MTT S90。
大胆猜测一下,美国突然要求禁令立即生效,当下弥补因英伟达被制约所空缺的市场刻不容缓,那么摩尔线程能否成为下一个赢家?
英伟达赢者通吃的秘诀:全功能GPU+CUDA生态英伟达是全球最大的全功能GPU(图形处理器)企业,垄断了全球AI芯片市场。英伟达的全功能GPU既可以用做游戏渲染,也可以做视频编解码,还可以用在AI和高性能计算。运行相同任务的情况下,英伟达GPU比CPU的速度要快10到100倍。
全功能GPU是在架构和硬件上走出的第一步,而实现通用性、兼容性,英伟达靠的是CUDA生态应用。CUDA是英伟达运筹多年的护城河,不是一夜间横空出世的。即便在连续多年业绩亏损、股价常年徘徊在10美元附近,黄仁勋也顶住压力大手笔投入CUDA生态的建设。至今,CUDA 已拥有超过 400 万开发者,超过 3000 个应用程序,下载量达到惊人的 4000 万次。全球有15000家初创公司、40000家大型企业正在使用CUDA加速计算。
“性能卓越、能耗可控、生态友好”是英伟达在软硬件建立起的全方位壁垒,也是深度学习库最有力的支持,国内公司难以企及。而且芯片生产具有挑战性,获得产能、保持良率、先进封装技术等环节也是国产GPU公司要解决的问题。
中国唯一全功能GPU,摩尔线程“爬珠峰”像英伟达一样,摩尔线程也做全功能GPU,选择了技术难度最高的一条路,相当于挑战大芯片领域的珠峰。目前,摩尔线程是中国唯一全功能架构的GPU公司,核心研发团队、技术路线均是英伟达正统传承。
企业级客户非常看重AI训练的性价比,需要更低能耗、更高性能的GPU,并且在多场景下有灵活性和兼容性,将运算失效率降到最低。一些国内政企集采项目,虽然已要求必须保证一定比例的国产GPU采购比例,但客户也要考虑国产GPU的算力效率,要让算力能真正能跑起来。
所以对国产GPU公司来说,全功能GPU在通用性、灵活性、兼容性上的优势,是最符合AI算力时代的技术路线。比如摩尔线程就有四大计算引擎,包括了3D图形渲染、视频编解码、人工智能计算、物理仿真与科学计算,芯片通用性强、生态广、服务场景多,除了数字办公、娱乐与创作、AI与云计算,还有元宇宙。
作为互联网尽头的终极想象,元宇宙拥有足够大舞台,据贝恩咨询发布的《Taking the Hyperbole Out of the Metaverse》研究表明,到 2030 年,元宇宙的价值可能达到 9000 亿美元。Gartner 也预测,2026 年全球 30% 的企业机构拥有用于元宇宙的产品和服务。
在如此巨大的机遇面前,摩尔线程联手世纪互联在云端率先部署了摩尔线程千卡级别的GPU算力集群,并成功将摩尔线程MTVERSE元宇宙平台与虚幻引擎和云渲染流化技术结合,为51Meet高精度元宇宙开放平台提供了计算加速,据说这也是业界率先实现国产化闭环的元宇宙应用。值得一提的是,作为实现元宇宙的先决条件——“数字人”技术,已被摩尔线程全新升级,构建了完整的数字人生产线。
摩尔线程不仅发展元宇宙,而且据集微网报道,摩尔线程也已在布局自动驾驶,其BOSS直聘的招聘岗位中,披露了自动驾驶算法专家及实习岗位,预计正在探索落地全新场景。
融入英伟达生态,取得阶段性胜利去年ChatGPT的出现让市场已经认识到AI为英伟达带来的巨大潜力,可见英伟达的竞争护城河是多方面的。通过CUDA,GPU应用范围从原来的游戏和3D图像处理扩大到了整个AI计算领域,包括航天、生物制药、天气预报、能源勘探等。
CUDA作为英伟达垄断GPU领域的关键力量,是国产厂商绕不过去的一道坎。CUDA本与英伟达自家GPU高度绑定,每进行一次GPU的迭代,CUDA架构就会发生很大的变化,要做一个新的生态替代它很难。目前,国内厂商走在兼容CUDA的道路上,这就像一场高中生与博士的对决。
对此,摩尔线程双线对战,一边发展自家MUSA元计算统一系统架构,包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构;一边适配了国内外CPU和操作系统,其适配的CPU包括飞腾、海光、龙芯、兆芯、鲲鹏、申威等,操作系统包括麒麟、统信、方德,还积极加入了国内操作系统开源社区,包括OpenKylin、DeepIn社区、OpenCloud、OpenEular、OpenAnolis等。
为了更方便的兼容CUDA,摩尔线程还推出了代码移植工具"musify",可快速将现有的CUDA程序迁移至MUSA,零成本完成CUDA代码自动移植,相当于手机的“一键迁移”功能。
在工信部电子五所信息技术创新榜上,摩尔线程显卡在不同国产平台组合上的性能测试包揽了前六名,其技术实力可见一斑。
结局:对标英伟达产品生态,快速拉近与其差距,目前看来,做全功能GPU的摩尔线程最有希望。但接下来将是中国企业最难熬的日子,唯有GPU产业链上下游抱团取暖,加速全国产化,才能建起中国AI算力基座!
END