商业世界越来越依赖人工智能这一重大技术进步,而英伟达是推动这场革命的关键参与者之一。
随着今年早些时候市值达到3万亿美元,这家总部位于美国加州的芯片制造商伴随GenAI崛起以来的也迅速崛起。英伟达的收入大幅飙升,同比增长262%,凸显了市场对其人工智能芯片的巨大需求。不过目前,英伟达的崛起可能遇到了一个障碍。
据The Information报道,由于“在生产过程中的异常”发现设计缺陷,NVIDIA最新人工智能芯片将推迟三个月或更长时间。
订购Blackwell新旗舰系列芯片的客户原本预计将在今年晚些时候收到货物,但现在可能要等到2025年。这一延迟预计将对谷歌、微软和Meta等已经订购了价值数百亿美元的英伟达芯片的客户造成重大影响。
几家英伟达的客户计划将在明年年初推出新的人工智能产品并建立数据中心,这种延迟可能会对他们的计划造成重大影响。
据估计,谷歌已经订购了超过40万颗GB200芯片。Meta也下了类似的订单,而微软希望在明年第一季度之前为OpenAI提供至少5.5万个芯片。
Blackwell AI芯片是广受欢迎的NVIDIA H100芯片的继任者,后者为全球大多数GenAI应用程序提供动力。今年3月,英伟达推出了Blackwell GPU,声称与H100相比,它们的性能提升了30倍,同时在某些工作负载下,能耗降低了25%。
据报道,NVIDIA的芯片生产商台积电(TSMC)发现了这一设计缺陷。人工智能芯片正在进行一系列新的测试。
根据The Information报道设计缺陷出现在将Blackwell GPU连接到单个NVIDIA GB200超级芯片上的处理器芯片时。英伟达目前正在重新设计芯片,可能需要几个月的时间才能与台积电进行生产测试。
有报道称,英伟达正在考虑生产Blackwell系列的单一GPU版本,以履行其对一些客户的承诺。然而,这种设计对性能的影响是有风险的。
英伟达可能更愿意推迟发货,而不是冒险推出有缺陷或性能不佳的产品,这似乎是英特尔第13代和第14代酷睿处理器所发生的事情。自2023年12月以来,英特尔处理器的不稳定问题一直困扰着玩家,并成为这家科技巨头的一大头痛问题。
虽然英伟达可能能够承受延迟,但其备受期待的Blackwell芯片的任何性能故障都可能是灾难性的。这不仅会给它的声誉带来灾难,而且代价也非常高昂。
一个GB200 Blackwell超级芯片的价格可能高达7万美元,而一个完整的服务器机架的价格可能超过300万美元。考虑到英伟达承诺生产的芯片和服务器的数量,Blackwell芯片的任何问题都可能对该公司造成严重的财务影响。
人工智能芯片的延迟到来正值英伟达面临另一个挫折。这家芯片制造商正在接受美国司法部对其人工智能应用的调查。该调查正在了解英伟达不公平地迫使云计算公司购买其人工智能芯片的指控,同时也在调查英伟达收购人工智能初创公司Run: ai可能违反的反垄断法。
英伟达的几家客户正在投资硬件研究,以在内部开发自己的人工智能产品。因此,NVIDIA必须尽量减少AI芯片延迟的影响,以保持其在市场上的领先地位。