决战大模型,九死一生

商业科技场 2024-04-03 16:59:08

撰文 | 王长胜

今日凌晨,备受行业关注的首批大模型产品获批名单终于出炉。一共八家:百度(文心一言)、抖音(云雀)、智谱AI(GLM)、中科院(紫东太初)、百川智能(百川)、商汤(日日新)、MiniMax(ABAB)、上海人工智能实验室(书生)。而之前热传的阿里通义千问、360智脑、讯飞星火均不在列。

百度官方公众号第一时间发布推文,称“文心一言向全社会开放”,王小川的百川智能和商汤也随即宣布面向全社会开放服务。

这八家公司获批的大模型产品都属于AIGC,即“生成式AI”,主要面向C端用户,由于涉及用户数据安全,正式上线前需要进行算法备案,并向相关部门申报安全评估,所以才有了“获批”一说。

说是“百模大战”,其实远远不止100家,目前公开数据可查的开发大模型的公司或者机构,少说也有几百家,如果算上那些基于大模型开展业务的初创公司,“千模大战”都不止。

去年年底,大模型的出现迅速燃爆了整个AI行业。当时,没有投资人不在研究这个赛道,但是,大半年之后的今天,投资人们变得相当谨慎。

这是一场万人抢夺独木桥的赛道,成功的概率极低。比当年团购行业的“千团大战”有过之而无不及。最后,活下来的只有美团,还是转型做外卖才起死回生。当年的电商也一样,各家巨头都推出电商平台,创业公司更是比比皆是,到最后,也只活下来三五家而已。短视频、直播,莫不如此。大模型之战,恐怕也会是这个结局。

中国大模型赛道似乎不信这个邪。从之前的报道可以看出,不管有没有“自研”的大模型,大都号称自己做大模型,哪怕只是套了一个壳,也都喊个“大底座”的故事。

下面我们就来盘点一下比较热门或者说比较受关注的几家大模型公司,看看他们的优势和劣势。

华为盘古:不作诗,只做事

这两天,华为MATE 60喜提了不少热搜头条,国产替代大有可为,不得不说,华为在通讯领域的技术、人才储备的深度和厚度是真的过硬。

以华为的技术实力,大模型之战一定不会错过。而且,盘古有个口号叫做“不作诗,只做事”。

在AI大模型领域,华为也已经布局两年。2021年4月华为正式发布盘古系列大模型,包括NLP、CV和科学计算大模型,后续还发布了矿山、药物分子、气象、海浪等行业大模型。今年7月7日,盘古大模型3.0正式发布,这是一个完全面向行业的大模型系列,包括5+N+X 三层架构。

L0基础大模型:包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型在内的5个基础大模型。

L1行业大模型:涵盖N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型。

L2场景模型:为客户提供更多细化场景,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。

从盘古大模型的布局来看,华为在各个行业的确有着足够的经验积累,盘古能够相对精准地解决单个行业的问题。缺点是,由于盘古大模型是由多个百亿级参数的行业大模型叠加在一起构成的,所以,它的通用算法能力不够强。另外,虽然盘古号称是参数最大的行业大模型,但是参数的稀疏性却是个问题。

严格意义上来讲,盘古大模型并不是一个真正的大语言模型,生成式能力不足的结果是“作不了诗,只能做事”。它不在首批获批名单之列,也在情理之中。但是盘古的综合实力和华为的技术储备,都让任何从业者不敢不恭而敬之。

腾讯混元:真正的“私人订制”

2022年底,腾讯发布了低成本、可落地的NLP万亿大模型——混元(HunYuan)AI 大模型,完整覆盖 NLP 大模型、 CV 大模型、多模态大模型、文生图大模型及众多行业/领域/任务模型。

在产业化方面,混元先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务,通过NLP、CV、跨模态等 AI 大模型,不仅为业务创造了增量价值而且降低了使用成本。

特别是其在广告内容理解、行业特征挖掘、文案创意生成等方面的应用,在为腾讯广告带来大幅GMV 提升的同时,也初步验证了大模型的商业化潜力。

腾讯混元的研发路径,比较与众不同。比如阿里和百度,都是先做模型,再找应用;先把通用性做起来,再去找行业输出。混元的研发路径是,先从腾讯各个业务线抽调人,没有形成一个完整的、成建制的团队,更像是一个松散的、虚拟化的工作组。抽调上来的人根据各自的业务可能用到的场景提炼出需求,然后,把这些需求整合到一起,开发出一个大模型。

这样做的好处是,混元能够在短期内做出来,而且天然地与腾讯业务结合的比较深、比较宽。缺点就是目的性较强,功能略显泛化,对自家应用的改造和升级有一定帮助,但是对外的产业化能力比较弱,不是一个面向行业的大模型。未来,要想在“百模大战”中赢得一席之地,有一定难度。混元不是一个天生能打的产品,更像是为腾讯自己私人订制,通过混元优化旗下的各个应用。

混元不是一个天生能打的产品,也不是一个通用型大语言模型,更像是为腾讯自己做的私人订制,通过混元优化旗下的各个应用。不在首批获批名单,亦在情理之中。

阿里通义:不好不坏的自研大模型

2022年9月,阿里达摩院发布通义大模型系列。该模型打造了AI统一底座,并构建了通用与专业模型协同的层次化人工智能体系,首次实现模态表示、任务表示、模型结构的统一。

通义大模型整体架构分为三个层次:模型底座层:多模态统一底座模型M6-OFA,实现统一的学习范式和模块化设计;通用模型层:多模态模型“通义-M6”、NLP 模型“通义-AliceMind”以及 CV 模型“通义-视觉”;行业模型层:深入电商、医疗、法律、金融、娱乐等行业。

在今年7月的2023世界人工智能大会上,阿里宣布推出通义大模型家族新成员“通义万相”。这是一款AI绘画模型,支持文生图等功能,它能够通过机器学习和自然语言处理技术,从文本描述中生成对应的图片或画作。

阿里云做的很早,但是阿里大模型做的却不算早。最早也不叫通义,后来两三个模型拼在一起,取名通义,由达摩院负责。众所周知,阿里架构调整,达摩院也受到波及。虽然,达摩院看着有上千号人,除去支撑内部各条业务线和外部服务的人,能够专注于开发大模型的核心团队也就那么几个人。从人力资源投入密度来说,通义不如其他几家大模型公司。

另外一个问题是延续性问题。分拆前后,通义原负责人杨红霞离职(后来去了字节跳动),负责自然语言处理的司罗,负责机器学习的贾扬清也相继离职。多位P10级以上的AI大神的离职,导致后来的通义略显拼接感。这也是最近一段时间,为什么通义在市场上的声量并不大的原因。

当然,有个例外,钉钉并入阿里云这三年,却沾了不少AI的光。这也是再次独立之后的钉钉敢于“后退一步”,做底层、做平台、做插线板的底气。

不管怎样,阿里的通义大模型确实还算是国内少有的自研大模型之一。而且,阿里云在决定大模型的三大维度——算力、算法和数据中的算力和数据方面,有着一定的优势。未来,阿里云要独立融资,IPO,通义大模型会有望获得重视和投入。尤其在To B的赛道上,通义大模型绑着阿里云,资源还是深厚的。

百度文心:厚积薄发,终于等到你

十年磨一剑,苦尽终于要甘来了。

说起来可能很多人不信,当“人工智能”对大部分人还是陌生词语的2010年,百度就已经开始全面布局人工智能了。在2017年,百度首届AI开发者大会上,创始人李彦宏更是直接喊出了“All in AI”的口号。

作为国内少有的戴着纯正技术光环的创始人,李彦宏对技术有着一种执念,时间久了,执念就会变成了信仰。

虽然,百度在移动互联网阶段被AT超越,但风水轮流转,潜伏多年的AI终于在“生成式大模型”的热潮中重回聚光灯下,成为全球科技领域的当红炸子鸡。百度文心大模型也终于等到属于自己的春天。

正是由于常年马拉松式的巨额投入(已投入超过1400亿元),百度成为了全球为数不多的全栈布局且每层都有领先产品和关键自研技术的顶尖AI公司。所谓全栈,指的是IT技术栈,可分为“芯片层、框架层、模型层、应用层”四层。

在芯片层,百度昆仑芯科技已实现两代通用AI芯片“昆仑”的量产及应用,为大模型落地提供强大的算力支持。

在框架层,“飞桨”是国内首个自主研发的产业级深度学习平台,集基础模型库、端到端开发套件和工具组件于一体,有效支持文心大模型高效、稳定训练。

在模型层,文心大模型包括基础大模型、任务大模型、行业大模型三级体系,全面满足产业应用和广大用户的需求。

在应用层,文心大模型不仅应用于百度自有业务的各类产品,并通过企业级平台“千帆”进一步推动生态构建,赋能千行百业。

此次被列入首批名单的文心一言底座的文心大模型,目前,已经迭代至3.5版本,与3.0版本相比,训练速度提升了3倍,推理速度提升了30倍。

不同于其他行业垂类大模型(讯飞星火基本等同于教育大模型,华为盘古只做少数几个关键行业),百度文心大模型秉持“从产业中来,到产业中去”,基本实现了从通用到垂直的全面覆盖。

百度还宣布,要用文心大模型把百度所有的产品都重构一遍,对,是重构,不是腾讯那种优化。

在算力、算法和数据方面,百度也是国内大模型企业中实力最雄厚的,这一点,毋庸置疑。

正所谓,思维决定命运。AI原生思维决定了大模型时代企业能取得的成果,当其他大模型玩家还在解决垂类行业问题的时候,百度真正在用大模型能力和AI原生思维重构业务线,把大模型能力用到了服务上亿用户的产品中去,可以说,已经拿到下一个时代的入场券。

讯飞星火:我有一个梦想

在所有大厂里,科大讯飞研发大模型是相对较晚的。

2022年12月15日,科大讯飞启动“1+N”认知智能大模型专项攻关,2023年5月6日讯飞星火认知大模型正式发布,涵盖了文本生成、语言理解、知识问答、逻辑推理等七项核心能力。并于6月9日、8月15日持续迭代。星火认知大模型主要应用于教育、办公、汽车驾驶、数字员工等场景。

在教育领域,讯飞星火认知大模型+学习机,可以AI写作批改、精细批改、给优化参考,俨然成为学生的智能家庭教师。在办公领域,讯飞星火大模型+办公(讯飞听见、讯飞智能办公本),可以自动会议纪要、自动语篇规整、一键成稿。在汽车驾驶领域,讯飞星火认知大模型+智能座舱,可以提供多轮、多人、多区域、多模态智能汽车人机交互范式,强化智能座舱的科技体验感。在数字员工领域,讯飞星火大模型+数字员工,优化了数字员工语音和文本交互体验。

前不久,科大讯飞宣布了与华为的合作,表示讯飞星火将与华为昇腾AI强强联合,全力打造中国通用智能新底座,最后还特地补充了一句,“国产大模型只有基于中国自主创新的算力底座才有大未来。”

说这句话,讯飞是对的。行业内都清楚,讯飞星火大模型发布之前,没有任何关于讯飞和大模型有关的新闻。短短几个月就能自研出大模型是不可能的。有消息称,讯飞可能用的是开源大模型底层,加以改造优化形成了讯飞星火大模型。这也是很多大模型中小厂的普遍做法。

行业内已经有人提出过这样的疑问,训练大模型平均一次就要500万美元以上的费用,以讯飞财报披露的营收和盈利数据来看,几千万元的净利润,用来训练大模型有一定难度。那么,接下来,如何保持迭代能力,可能是困扰讯飞星火的一个关键因素。

但是,讯飞星火在教育领域的优势还是比较突出的,如果讯飞能安下心来踏踏实实主攻教育赛道,以科大讯飞的体量来说,是最合适也是最合理的。

讯飞的几款硬件产品也都不错,包括我一直在用的讯飞只能办公本,采访的时候打开,语音直接生成文字,几乎没有错别字,识别率超过90%,很实用。

这与讯飞长期的技术积累密不可分,尤其是在语音能力和语义能力的理解上,有一定的行业地位。而对于自然语言处理、图像能力等方面,也就是多模态能力,讯飞并没有太多积累。

讯飞星火还有一个优势,就是讯飞的政企资源较丰富,业务能力强。目前,讯飞正在江苏、山东等地与政府部门谈,希望拿到一些产业园、工业园的资源,比如跟政府签一个打包的协议,然后在这些园里的企业是不是都能用它,或者采购一笔。这是很多企业羡慕的资源。

受地域限制,科大讯飞偏安合肥,要想招到北上广深杭的AI领域的顶尖人才,有一定难度,而且随着大模型赛道的火热,此类人才的成本也是水涨船高。讯飞可以利用好中科大资源,自己培养行业人才,一旦养成,偏安一隅便成了优势,人才不易流失。

所以,综合来看,讯飞星火充分发扬在教育领域的优势,专心继续深耕,或许是更好的选择。

字节云雀:不拉垮,也不惊艳

除了上述几家比较头部的大模型企业之外,还有一些进入比较晚的大厂以及专注于大模型的初创公司,我随便选几个有关注度的聊聊。

首先说字节,也就是抖音,这是互联网行业不可小视的力量,下一个时代的巨头。但是,为什么抖音在大模型领域没有什么动静呢?此次突然出现在首批名单当中的抖音云雀大模型,大家也是比较陌生。

其实是这样,按照字节一惯的套路,低调,猛做但不张扬。以抖音的人才密度和深度,以及资金实力,未来在大模型行业里,抖音云雀都是一个极具竞争力的玩家。从内部投入来看,投入力度和态度,要比华为、阿里和腾讯更决绝,更猛烈。

抖音云雀大模型下面有个To C的产品叫豆包,试用了一下,感觉并没有那么拉胯,及格,当然也没有多么惊艳。作为一个新产品,已经很可以了。

百川:新新公司的希望

百川智能,今年上半年才成立的大模型赛道的新新创业公司,创始人王小川,此前的搜狗创始人,学霸,颇有传奇色彩,创业就自带光环。

6月15日,百川智能推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。几天前,百川智能又宣布推出新一代大模型Baichuan-53B。

可以说,百川也是真的拼了,这迭代速度真的可以。但是,作为创业公司,百川能够在首批获批名单当中,这对于王小川来说是一个天大的好消息。要知道,创业公司做大模型最缺的不是钱,而是数据。与BAT的庞大数据量相比,没有大量数据来训练大模型,是不可想象的。当然,创业公司也缺钱。大模型训练一次,500万美金起步,这对于创业公司,恐怕是难以支持的。

当然,最可喜的还是百川能进入首批获批名单,能够吃到第一波红利,至少能暴涨不少用户,既打了品牌,又积累的用户数据,这是好事,也是相关部门的考虑因素,放一个初创公司进来,看看效果。

智谱、智脑及其他

智谱,是国内最早一批研发大模型的企业。成立于2019年,由清华系成果转化而来,身上有一些清华光环。

当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。

基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。

但是,毕竟不是大厂,无论财力还是人力,智谱大模型肯定是没有优势。但是,他们走了一条适合自己的路,就是对客户的服务比较紧密,贴身服务,定制化服务。而且,与字节、360也有合作,与他们一起打单政企客户,属于寄居性的商业模式。问题是,这种定制化服务,客户少还能服务的过来,如果客户多了,服务质量就难以保证。这是智谱目前暴露的问题。

360智脑大模型,与智谱有点类似,主要针对政企客户,深入服务,至于大模型本身的技术能力,不是很突出,也不是很重要。以周鸿祎的作风,品牌肯定先打出来,占个位置。以360的财力,也是难以支撑大模型的迭代训练的,当然,业内人士分析,360智脑大模型的底层应该来自于当初还开源的某个底层。

至于其他,很多大型中型企业、各大院校、三大运营商等等都有大模型推出,加上更多为大模型而生的初创公司,写是写不完的。

最后还是那句话,大模型三要素:算力、算法和数据,缺一不可,而背后支持的就是资金和人才。

这是一个烧钱大战。当然,烧钱才能把行业烧热,才能诞生新技术、新革命,这也是大模型从业者对于下一个时代的光荣责任。

过几年回头再看,就理解了这个标题,决战“大模型”,可能不止是九死,而是“百死一生”。

0 阅读:0

商业科技场

简介:感谢大家的关注