央国企大模型市场在拼什么?既要全链路贴身服务,又要标准化产品快速落地。而具有两方面能力的企业非常稀缺。
文|牛慧 周享玥
编|赵艳秋
奇瑞董事长尹同跃,出席了10月24日在合肥举办的第七届世界声博会暨2024科大讯飞全球1024开发者节。他称大会的盛况,让他们“羡慕嫉妒”。
在过去一年,科大讯飞在大模型技术上的突破,在教育、医疗、能源等行业的落地,以及不断扩大的生态圈,让这届大会更加丰富多元。
大模型迎来了技术应用落地时代。尤其在大模型落地重镇——央国企市场,科大讯飞取得领先位置。伴随央国企大模型从筹划到落地、从浅中层应用走向深水区,从标杆项目到规模化,科大讯飞也展示了一套独特的打法。
01
兵家必争之地
央国企,再次成了“打头阵”的力量。
去年下半年,不少央国企已开始筹划大模型建设。而随着今年2月国资委召开“中央企业人工智能专题推进会”,大型央国企纷纷启动大模型建设。它们有动力、有场景、有基础、也更有资金实力,成为各行业推动“人工智能+”的主力军。
每一家央国企往往代表一个行业。对大模型厂商来说,每做通一家央国企,就意味着可能打开一个巨大的行业市场。“比如中石油、中海油、中石化、国家管网这‘三桶一管’,加起来每年的产值有几万亿元,在这里去寻找一个大模型落地的市场空间,想象力非常足。”一位大模型厂商资深人士说。
央国企也因此成了大模型主流厂商的兵家必争之地。各家都在押注重兵和资源,“拿项目、拼中标”,希望能最先成为市场“第一”。一些阶段性成绩单已出炉。根据第三方数据,2024年1-9月份,科大讯飞中标项目达到38个,中标金额达21607万元,在大模型市场的中标数量、中标金额位列第一。
数智前线不完全统计的数据也显示,今年前三季度,645个市场整体大模型中标项目中,科大讯飞在项目数、金额上实现领先。这些项目,主要分布在通信、金融、能源、教科等行业,以央国企客户为主。
开发者节上,科大讯飞董事长刘庆峰也晒出了一张写着“央国企中标第一、教育医疗市场第一”等行业第一的大模型技术应用落地的“成绩单”,并迅速在业界引起关注。
刘庆峰说,近期发布的三个行业大模型——中石油的昆仑大模型、中海油的“海能”人工智能模型,中国绿发的泰山大模型,科大讯飞都提供了大模型底座支撑。
除了这些合作,科大讯飞还与厦门航空构建了航司大模型;与华润合作构建了私域大模型。在汽车领域,截至10月,科大讯飞与奇瑞、大众等8家车企开展大模型合作,率先开启大模型落地汽车步伐。在金融领域,科大讯飞帮人保集团打造了“数智灵犀-人保大模型”,与交通银行共建人工智能联合创新实验室……
为什么是科大讯飞?24日发布会当日,科大讯飞总结了一套自己的大模型落地方法论——企业部署大模型,是“建算力、理数据、训模型,到落场景、保安全、精运营”的全链路服务。
这里涉及多个关键节点——能否搭建好算力平台?能否更高效、高质量地整理数据?能否建立各种尺寸模型,满足企业应用?能否保障使用安全?能否在运营中拿数据证明应用成效?市场的现实是,很多企业只做到第三步——训模型。这样的差距,让科大讯飞中标比例越来越高。
另外,为了更好服务央国企市场,科大讯飞在去年整合了讯飞研究院、相关业务单元及部分前场力量,成立了一级组织——星火军团,专门承担央国企侧的大模型解决方案探索开发和市场拓展。
虽然大模型展现了巨大的应用潜力,但行业的落地难度也非常大。星火军团总裁刘江说,过去一年里,讯飞和伙伴一起攻坚克难,实现了一个又一个行业应用场景。
而就在科大讯飞全球1024开发者节活动同一天,国资委“中央企业人工智能特训班”正式开班。“当天的会议面向央企董事长、总经理层面。未来十天可能有更多央企领导将进行封闭培训。”一位业内人士说。这是一个信号,预计未来由央国企领头,更多行业级大模型以及应用将加速涌现。
02
“贴身飞行”
在诸多央国企大模型项目中,中石油今年5月联合科大讯飞、华为和中国移动展开的昆仑大模型建设,受到普遍关注。这个集几方力量建设的项目,基于通用大模型和中石油独有的历史数据,来训练不同尺寸、不同模态的行业模型,不仅服务于中石油内部,也将对社会开放。
科大讯飞旗下的讯飞星火军团、羚羊公司、讯飞听见团队都深入参与了研发。
“实践中,我们总结了大模型行业落地要关注的三类10个问题。”羚羊公司总裁徐甲甲说。
其中第一类模型体系架构,涉及业务需求梳理、模态规划与尺寸选择、模型规划三大细分问题。第二类数据的获取与使用,包括行业语料、数据权限、数据训练、模型及数据安全四个问题。第三类应用的价值挖掘与开发,涵盖分工协同、场景能力与价值、业务流程优化三大子问题。
以业务需求梳理为例,中石油在集团层面成立了9个人工智能工作专班。“我们以业务为导向,只有用得好的、经过业务检验的,才能留存下来。”一位中石油人士告诉数智前线。科大讯飞数十位技术专家也在现场,和中石油业务专家一起,规划场景。目前已形成214个应用场景,1100多个细分场景。
在大模型训练中,高质量数据集是非常有难度的工作。中石油目前举全集团之力,在分批次进行行业语料收集,并在语料标注上,建立起从需求到质量验收的完整流水线。
“我们在现场做了很多工具,逐步在海量数据中,将低质量数据清洗掉。”星火军团副总裁、讯飞研究院副院长王金钖告诉数智前线。同时,他们也找到方法,逐步将跑通某个场景的数据要求降低到几万条、一万条直到几千条。
这个过程中,工具链的沉淀至关重要。科大讯飞逐步形成了一套工具链。尤其针对知识采编,这个大概占了大模型落地工作量的80%、将企业私域数据转化为大模型可利用知识的工作,讯飞创造了“全自动化多模态零采编”解决方案。目前在中石油、中国绿发、华润和厦门航空都在使用。
经过3个月的多方奋战,今年8月,中石油发布8个行业大模型,并在此基础上发布了三类应用产品——专业应用、员工助手和行业大家,涉及18个应用场景。
其中,和每一位中石油人有关的是“员工助手”,它帮助员工在公文撰写、智能运营、营销策划等场景解决各类问题。有趣的是,科大讯飞一直强调的“打造每个岗位的AI助理,每个员工的AI助手”,正是最先撬动央国企大模型落地的应用。
从这些AI助手中,科大讯飞也选择了有共性需求的产品,如代码、招投标、合同审核等,在企业市场上规模化推广。在国能e购,研发团队今年开始使用星火飞码iFlyCode,研发效率提升15%。
在这个过程中,基于羚羊能源大模型,科大讯飞旗下羚羊公司开发了大小模型统一纳管的AI平台,具备大小模型统一训练及纳管、算子库、上百个算法及数据标注、模型训练推理的等全栈式“开箱即用”的底座能力。基于该技术,羚羊公司承建了国家能源集团AI平台,是国能集团推动AI应用落地的基础性平台。
在开发者节期间,羚羊能源大模型升级至2.0版,视觉大模型、时序大模型能力跃升,并发布了一系列发电场景和石油石化场景应用。
科大讯飞也协助中石油成为首个在中国能源化工行业通过备案的大模型。
央国企构建大模型,有非常多的门槛要跨越,因此并不是单纯地买卖模型,它涉及专业完整的链条。不仅如此,科大讯飞也要协助央国企培育自己继续训练大模型、探索新场景的能力。这需要技术培训,也要共同沉淀像数据格式设计等标准,包括不断丰富生态支撑。
当下一些人工智能企业正面临大模型商业落地“窘境”。在ToC应用市场,大模型的广告变现效率,比传统App要低很多,成本又高出一两个数量级。对于ToB应用,有大厂研究院提出“中标越多,失血越快”。
央国企作为当下大模型落地探索的主力军,他们与科大讯飞等企业共同实践提炼的方法论,将影响整个行业的革新,并对未来大模型在更大范围的落地和应用,带来指导和借鉴。
03
“硬币的两面”
在客户和生态伙伴看来,科大讯飞在这一轮央国企市场争夺中之所以表现不俗,有几个关键因素:大模型技术、自主可控、定制化与标准化互为辅助的商业模式,以及不断降低的大模型落地成本。
其中,大模型技术是最基础的要求。“科大讯飞的优势在于,它有教育等行业沉淀的知识语料,大模型在国内是领先的。”一位央国企人士对数智前线说。
由于早期的算力紧张,科大讯飞在开发高质量数据集上做了大量艰苦的工作,也较早发现了高质量数据对模型训练的重要性。“它曾在很长一段时间,以百亿规模参数模型,与市场上数百亿、上千亿参数模型进行较量。”一位人士观察。
在这次开发者节上,科大讯飞又推出讯飞星火4.0 Turbo,持续追赶全球标杆,在涵盖理解和推理、数学和科学、代码等14个主流数据集中,在9项数据集中,实现对美国三大主流大模型的超越。
这次首发的支持除中英文外8个语种的星火多语言大模型,有科大讯飞人士称,“ChatGPT的多语种开始落地了,我们至少要与它同步进入市场”。多语言语音能力已成为中国汽车出口的“必选项”,目前传统上的汽车业六大国企——一汽、东风、长安、上汽、广汽、北汽均使用了科大讯飞车载多语种方案,智能化的中国车型受到了世界各地车主的欢迎。
大模型技术之外,央国企市场重视算力安全和自主可控。如能源行业承担着保障国家能源安全的重要使命,自主可控是前提。去年科大讯飞与华为特战队开展了联合攻关,首个国产万卡算力集群“飞星一号”平台上线,讯飞星火也是目前唯一基于全国产化算力训练而来的通用大模型。
此次,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的“飞星二号”正式启动,将带来智算集群规模的再次跃迁。
科大讯飞的商业打法也很有趣,它做了硬币的两面——定制化和产品化。这看似普通,但现实中同时具备两种能力,并将其有机结合的企业非常稀缺。
一方面,央国企都有定制化需求,科大讯飞也强调不以买卖方式,而以解决方案的模式,帮央国企去构建行业大模型,实现标杆性应用落地。
“以汽车领域为例,每一个车厂都有独特的需求,如广汽就更有做粤语的需求。”一位讯飞人士说,公司进入汽车业20多年,更多是一个Tier1供应商的角色。“在国内,如果你想在一家供应商将智能座舱软硬方案买齐,而这家供应商又愿意站在背后提供服务,基本上只有科大讯飞。”它在各大车厂都有驻场团队,有工程能力,可以贴身解决车企需求。
硬币的另一面,科大讯飞也是一个产品化公司。它有学习机、翻译机等,这次又发布了超拟人数字人、AI作业过滤器、高中数学智能教师系统、星火智慧黑板2.0、智能座舱人机交互效果评测机器人VIAS、多语种AI翻译透明屏等。展厅中,展示了羚羊数字工匠、星火智能合同、星火数字员工平台等岗位助手。这些应用,将进一步赋能企业的解决方案。
定制化和产品化的打法,让它的落地模式和价值变现更多元和均衡,市场规模也更大。
另外,科大讯飞还在不断降低央国企落地大模型的成本。
科大讯飞在采用“通用大模型+专业大模型”模式打造的央国企解决方案上,探出一条成本越来越低的商业化落地路径:结合一个通用大模型的语义理解能力,同时调用几亿、几十亿、乃至几百亿的大模型来组合完成任务,可以实现高性价比方案。
同时,端侧大模型的落地,除了能保护隐私,也带来了成本降低。讯飞这次发布了汽车端侧星火大模型,单车模型只有13亿参数,在应用中实际效果只下降了1%,而它所需的推理成本要小得多。
在取得阶段性成果后,央国企和科大讯飞依然有更多挑战去解决。一位讯飞资深人士称,在这些浅中层的应用落地之后,马上面临走向深水区的问题,比如电力调度这样非常有深度的生产场景,这更多要依赖复合型专业人才。
刘庆峰认为,人工智能产业发展的关键是五个关键词——顶天立地、自主可控、通专结合、端云联动、软硬一体。这在一定程度上也折射出这家企业的商业打法。“业界有一句话是‘星光不负赶路人’,而在讯飞内部也有一句话——星火不负赶路人。”科大讯飞刘江说,在央国企市场,他们希望在赢得信任的前提下,有更多伙伴能加入共创团体,参与到行业大模型建设和落地中来。