当国内大模型的齿轮开始转动,谁是真“夺宝奇兵”?

新芒 2023-08-19 13:23:06

最近国内大模型的热度又被推到了一个新高度。

不知大家有没有刷到一个关于大模型汇总的图,还被诗意地命名为“大模型的深渊”。

整体数下来,密密麻麻的100多家模型,分布在不同的领域,诸如医疗、金融、教育等。

就在近期,我们看到多家厂商也各自发声,颇有“你方唱罢我登场”的即视感,为自家大模型摇旗呐喊。

比如百度在WAVE SUMMIT深度学习开发者大会披露文新一言最新进展,并推动星河大模型社区,百度CTO王海峰亲自分享;科大讯飞的星火升级发布会,刚大手笔减持完股票的董事长刘庆峰强势分享;此外雷军的个人“成长”主题演讲中夹带“私货”,为其大模型站台;腾讯高管在财报后的电话会议中迫不及待的透露进展;甚至中国气象局都发声,称要启动气象预报大模型等新兴技术研发;还有大经中医发布“岐黄问道·大模型”。

银河证券最新报告表示,目前国内大模型竞争激烈,未来或迎来“万模大战”。 但可以预见的是,看似纷繁多彩的大模型表象背后,必定有的花里胡哨叫嚣一番,有的则凭实力上位,拿到通往通用人工智能的门票。

整体来看,百度文心可看作是大模型先锋队,毕竟高举AI招牌这么多年,技术实力也不是吹的。其他模型则有不同的侧重点:比如讯飞星火在语音交互和教育赛道上具有传统优势,小米大模型则注重终端部署,腾讯旗下“混元大模型”开始应用内测阶段小心谨慎推进。

我们今天也从几家当下火热的大模型表现切入,来一一探寻探寻其真正的实力,如何让这些技术惠及社会各界。

当大模型命运的齿轮开始转动

当大模型的齿轮在关键节点转动之时,那种带给整个社会的效率变革、生产力提升、之于个人和企业的机遇,是每个组织、个体都为之兴奋和不能置身事外的。

哈佛大学计算机科学教授杰弗里·辛克莱尔在其文章中指出,人工智能大模型将引发新一轮的人工智能革命。

然而,和当年团购时期的“百团大战”不同,想要真正驾驭大模型这件“利器”,单纯的“为爱发电”和人海、资本战术显然已远远不够,更需要技术深度与持久积累。

大模型中的“夺宝奇兵”:各显神通进行时

这个新世界,必须用具体细节加以描绘。

提到大模型,亦或者人工智能,在大众的认知中自然首先想到百度。公开信息可查,百度从2019年3月开始搞预训练模型,就是文心大模型的前身,并发布ERNIE 1.0。

▲图注:来源百度官方公众号

当时整个行业还处于两眼一抹黑的状态,没有人知道预训练模型是啥,更别提大模型。但没有影响百度的这股犟劲,四年多的时间,陆续发布了多个大模型,并在今年3月推出知识增强大语言模型文心一言,成为全球科技大厂中最先发布大语言模型的公司。日拱一卒,文心大模型优势逐步凸现,在算法创新、模型设计、训练技术、产业应用等方面已经处于领先地位,还促成了飞桨生态已凝聚800万开发者,基于飞桨创建了80万个模型的成就。

多项权威评测结果显示,文心的综合实力高居各大模型之首,用鲜明的技术基因,走出一条百度特色的大模型发展路径。可以说,文心大模型算是国产大模型里的“扛把子”、多边形战士了。

▲图注:来源科大讯飞官方公众号

此外,后起之秀科大讯飞的大模型发展路径也值得关注。星火大模型调子起的颇高,也很会造势,动辄就对标ChatGPT或ChatGPT4,抛开技术实力,或许这是其他很多公司需要学习的。这次升级发布会重点介绍了其代码能力和多模态能力升级版本。笔者看完也发现不少亮点,比如“使用Python处理视频星火.m4v,提取其中第2到10秒,保存成gif图片”的演示,非常丝滑。另外喊出要做教师好帮手,一键生成教学课件ppt着实让老师直呼内行,甚至被种草。

整体看下来,有这样一种感觉,不知会不会成为共识:科大讯飞的星火认知大模型约等于教育大模型,似乎离真正的通用大模型还差点意思。有业内人士也分享到,还真不如干脆改名讯飞教育大模型,专攻教育赛道,不要跟百度阿里们去硬刚,没机会的。整场发布会可以看的出刚减持完股票的董事长刘庆峰是很兴奋和自信的,和研究院院长打配合,全场高能。但一贯对消息敏感的资本市场似乎不解风情和不认账,发布会第二天放量大跌8.63%,盘中触及跌停,一机构还卖出1.32亿元。个中滋味,或许只有讯飞能懂。

▲图注:来源雷军官方公众号

科技圈子里的劳模雷军,在刚刚举行的个人“成长”发布会上分享的故事让人感慨,3个小时的分享,单拿体力来说,还是很能打的。当然也不忘给大模型发声打广告。喊出了诸如积极布局人工智能、全面拥抱大模型等不痛不痒的言论。这里有一则关键信息就是与其他公司不同,小米大模型技术的主力突破方向为轻量化、本地部署。后来,小米的又一高管表示,端侧AI大模型很可能是为5G而生。5G的突破载体是AI大模型。虽然看不太明白这里面的逻辑,但作为4月才成立专职大模型团队的小米,依旧任重道远。

在看腾讯在大模型的动作,感觉主打一个四平八稳。一句话概述就是,腾讯高管在财报后的电话会议表示,基础大模型正在顺利推进中,今年下半年会有升级。再具体一些,比如腾讯云MaaS最新升级,上架20多个主流模型,支持开发者一键调用;腾讯云智能推出全新文案创作工具。

阿里方面,推出了阿里通义大模型,甚至还豪横地称作大模型家族。主要是因为和其他家的以版本号命名规则不同,他们根据不同能力,分别推出了" 通义千问 "" 通义听悟 "" 通义万相 "。 别的不说,就" 通义听悟 ”为了推广,免费赠送的超长体验时长,我用来转写过单条1个多小时的语音,整体还是很赞的。但拆分之后,尤其是取消技术中台之后,压力都给到了阿里云,大模型的势能具体走向如何有待观察。

可以看出,在大模型领域,各家企业正以各具特色的方式进行布局、推进。真正站得住脚的企业必然是那些提前布局、持续进行原创性技术创新、不断进行自我超越的企业。从市场上众多大模型产品来说,能在技术上真正占据制高点、并取得广泛落地的,只有极少数,只有在算法、应用、用户、品牌等多个维度全面突破,才有可能占得一席之地。细数综合来看,要实现从技术到应用的全面落地,文心大模型表现出了应有的样貌。星火大模型通过造势刷出了自己的存在感,甚至连擅长搞营销的小米都得要好生学习了,腾讯和阿里的表现可谓符合一贯的调性和预期。

让我们拭目以待,相信中国的科技企业一定能在这场变革中抓住历史机遇,以开放和包容的姿态进行技术探索,让人工智能真正造福社会各行各业,成为推动经济发展的重要动力。

新芒x如是说

世界不是绕着新的叫嚣的发明者旋转,而是绕着新的价值的发明者旋转,世界无声无息地旋转。

通过这次讨论,我们看到人工智能领域正在出现一个激动人心的新时代。大模型技术的进步,带来生产力的飙升。从百度文心到阿里通义,再到天气预报、医疗领域,国内企业正与时俱进,推进自己的大模型产品进化。

这也预示着一个机遇与挑战并存的新阶段。在热烈的浪潮下,我们更需要审慎理性地看待大模型。技术只是手段,真正可持续的发展需要落实到具体的应用场景中。

展望未来,人工智能还有很长的路要走。大模型只是通向强人工智能目标的一个技术范式。我们要保持开放和包容的心态,与时俱进,共同推动这一领域的繁荣发展。

0 阅读:24

新芒

简介:专注AI,聚焦5G、云计算、智能硬件的精品自媒体。