【中国全力投入,DeepSeek推出新的 AI 模型】
(路透社)——DeepSeek 正在寻求进一步扩大其优势。
上个月,这家中国初创公司凭借其低价的人工智能推理模型引发了全球股市逾 1 万亿美元的抛售,其表现优于许多西方竞争对手。
据三位知情人士透露,目前这家总部位于杭州的公司正在加速推出 1 月份 R1 车型的后续车型。
其中两位表示,Deepseek 原本计划在 5 月初发布 R2,但现在希望尽早发布,但没有提供具体细节。
该公司表示,希望新模型能够产生更好的编码,并能够推理除英语以外的语言。R2 的发布时间表的加速细节此前尚未报道过。
DeepSeek 尚未回应对此事发表评论的请求。
竞争对手仍在消化 R1 的影响,它采用性能较弱的 Nvidia 芯片打造,但与美国科技巨头耗资数千亿美元开发的芯片相比仍具有竞争力。
印度科技服务提供商 Zensar 的首席运营官 Vijayasimha Alilughatta 表示:“DeepSeek 推出 R2 模型可能成为人工智能行业的一个关键时刻。”DeepSeek 在创建具有成本效益的人工智能模型方面取得的成功“可能会促使世界各地的公司加快自己的努力……打破该领域少数主导者的束缚,”他说。
R2可能会让美国政府感到担忧,因为美国政府已将人工智能的领导力列为国家优先事项。它的发布可能会进一步激励中国当局和企业,其中数十家企业表示已开始将 DeepSeek 模型集成到其产品中。
关于 DeepSeek 的信息很少,其创始人梁文峰通过其量化对冲基金 High-Flyer 成为亿万富翁。梁文峰被前雇主描述为“低调内向”,自 2024 年 7 月以来就没有接受过任何媒体采访。
路透社采访了十几名前雇员以及熟悉 DeepSeek 及其母公司 High-Flyer 运营的量化基金专业人士。它还查阅了官方媒体文章、这些公司的社交媒体帖子以及可追溯到 2019 年的研究论文。
他们讲述了这样一个故事:这家公司的运作方式更像一个研究实验室,而不是一个盈利性企业,而且不受中国高压科技行业等级传统的束缚,尽管它促成了许多投资者眼中人工智能领域的最新突破。