金融业一直是新技术的实验场。今年在大模型和自主创新上,有怎样的新进展?
文|赵艳秋
编|牛慧
兵强马壮的金融业一直是新技术的实验场。虽然今年不少金融机构的预算有所缩减,但在大模型、自主创新上仍有不少新动向。
01
头部大行谨慎推进大模型
7月在北京举办的中国国际金融展上,不少业内人士来参观交流大模型应用。有趣的是,自今年5月以来,更多银行上线大模型,员工已开始接触到各类助手。但大模型在金融业仍处于尝试早期,甚至应用速度和深度不及制造业。
行业人士形容,金融在大模型上是在做大规模研究,小范围验证和测试,应用以工具类如助手为主,没有用在交易生产业务中。
“并没有大规模用起来。”一位头部金融应用开发商告诉数智前线,自己对此的标准可以用一个例子来说明,比如“我要开个户”这一句话,涉及合规监管、数据报送,流程中还涉及多个业务部门、各种审批手续。“这些都是隐含机制。真正的大模型,要根据这一句话,把所有需求、业务流程拆解清楚,现在还做不到。”
“与其说是做不到,不如说是不太敢。目前用AI正儿八经做交易业务,真的不太敢。”一位城商行人士告诉数智前线。
实际上,头部大行早在ChatGPT爆火之前,就对生成式AI开始了研究。但由于大模型的准确性问题和不可解释性,一向严谨的金融部门需要不断尝试观察。同时,金融业也还没有找到足够的痛点,实现更高价值,体量也不太够。
在此状况下,大行呈现了谨慎务实的态度。“其实有很多环节,传统方法也很高效,比如关键词检索。”一位工商银行人士告诉数智前线,“我们还是要先解决业务问题,如果业务不需要,硬往里面揉,反而效率会降低。”他强调,不会为了技术而技术。工商银行内部主要的应用目前包括代码助手、客服、风控等。
中国银行则用大模型做了数据分析等。一位人士告诉数智前线,内部进展不算快,风控还未上。
一位建行人士称,她看到内部在5月上线了大模型。她用大模型帮助撰写对公业务的定制化研究报告。“目前这些报告的针对性还不够,需要修改大约一半内容,但你要往前推,这是一个趋势。”这位年轻人士称自己非常关注大模型,早在ChatGPT、文心一言刚推出时,个人就尝鲜使用过。
目前,大模型在金融业的应用,基本上是代码开发、运维、交互式数据分析、营销工具、保险报价等。因为应用场景有限,一位大模型厂商负责人表示:“没想到代码助手在银行变得如此突出。”
除了大行,从金融体系的步伐看,一些城商行或合资银行与大行不通,节奏要更快一点。“投入几百万元,就能解决一个实际问题。”
值得关注的是,金融企业用来训练企业大模型的基础模型或金融行业大模型,较为多元化。商用的如华为盘古、智谱,开源的如阿里通义、智谱、百川、国外的Llmma等,但他们坦言,行业大模型还没有特别突出的。此外,一些银行业务人员通过口口相传,也在使用Kimi等作为文档小助手。
“银行最大的问题是它的数据不能出去,只靠自己的数据去判断用户的行为习惯,有局限性。”因此,不少银行在数据的合作上非常下本。
一位杭州银行人士称,他们与浙大合作,核心是基础数据训练。“模型有开源的,但数据很难,投入近千万元。”目前的应用场景集中在助手类,如杭小助、代码助手、合同审核等。
除了数据,大多数银行是先购买算力。“智算从2022年左右开始。”多位人士称,由于英伟达芯片出现了几次对不同产品的禁售问题,供应不稳定,金融企业这几年搭建了异构算力平台。
总体而言,在金融行业,大模型离全面落地应用还有时间。除了六大行和股份制银行一共21家企业之外,不少城商行和保险企业也在尝试。一位城商行人士告诉数智前线,自己正在调研,准备开展小范围试点。
“这个方向是确定的。”一位金融应用开发商说,“只是什么时间走到大规模落地,每个人都想知道答案。”
02
核心系统自主创新处于攻坚期
除了大模型,金融企业的科技战略已步入深水区,一个明显特征是,传统技术架构正面临转型和重塑,新体系与“IOE”完全不同。
其中,核心系统的改造并非易事,涉及从操作系统、数据库、中间件到硬件的全栈能力:各种技术都要达到性能及稳定性要求;无论开闭源,都要经历规模性的商业化验证;各类技术不是简单的替代,而是要实现新一代业务的高要求。这里数据库的替换最具代表性。
在这方面,头部银行走的较快。不少银行从外围系统开始,目前处于核心系统的攻坚阶段。“数据库还没有完全替换,接下去还有并跑阶段,所以看上去走的快的好像已完成70%~80%,但周期还很长。”一位业内人士介绍,如果说要完成全部核心替换的话,可能在明后年。股份制银行比头部银行还要慢一些。
除了头部和股份制,城商行和农商行则是点状分布,一些局部的城商行走得比较快,已完成核心系统的改造。“一个趋势是在往下渗透,一些规模更小的银行开始启动了核心系统的改造。”
而在这个过程中,数据库市场也在被重塑。虽然目前有300多家国产数据库企业,“我觉得在这个过程中,数据库会进一步收敛在几个厂商。”一家数据库企业判断。
在数据库的替换中,有业界提出,这些采用了新架构的数据库,替换成本高、不好用等问题。但一位城商行人士明确告诉数智前线,“我们2015年去考察替换的出发点,就是因为成本。传统的集中式架构,长期成本很高。每年的维保、软硬件、人员成本都很高昂。替换肯定是节约了成本,否则当初不会去干这件事。我觉得要从长期看成本。”
从替换的技术复杂度来看,伴随国产数据库的进步,平台迁移的难度已不太大。但在银行原有应用改造上,确实有一定难度和复杂度。因为数据库需要做到多活的同时,保证数据的一致性;而在保证数据一致性的时候,还要保证高性能,这确实需要一定的能力支撑。
在可用性上,“我认为已经没有什么差异了,能确保生产连续稳定的运行。”一位城商行相关负责人说,而差距则主要体现在生态和服务上。比如,国产数据库的技术普及和应用人才供给不够。再如,在服务体系上,以IBM为例,用户遇到故障只要打一个电话,就能自动化地解决,国产数据库则需要四处“摇人”。
“如果说要判定哪天追平了,我认为有一个非常好的标志,就是我不见这些数据库企业的人,打个电话就能解决所有问题。”上述人士对数智前线说,这需要一套体系和知识沉淀。
在金融行业,数据库企业各分天下,不少金融机构提到蚂蚁OceanBase、腾讯TDSQL、中兴金篆GoldenDB、华为高斯,不像操作系统领域,麒麟占据主导。
“这几家企业的打法也非常不同。”一位行业人士说,蚂蚁OceanBase下场早,在城商行、农商行、保险证券市场占有率高;华为则通过全栈产品携高斯数据库,猛攻市场;中兴也提供全栈产品,包括操作系统、数据库、服务器等,它采用集中兵力的策略,只做银行核心系统;腾讯TDSQL则在市场上“全面发力”,既做本地部署,又做公有云,既做头部大行,也做中小型金融机构。
核心系统除了软件外,还需要高性能的计算、网络和存储,如FC光纤存储。目前,针对光纤存储,业内处于创新性研究阶段。由于核心系统需要全栈能力,华为、中兴、新华三等企业利用全栈布局,强攻市场。
03
硬件应用呈现百花齐放
硬件的创新从机具开始。有趣的是,此前采用麒麟系统的金融机具占有大部分市场,而从去年下半年开始,鸿蒙机具也在起势。在中国国际金融展上,可以看杭州银行试点的鸿蒙自助设备。
在电脑方面,联想在金融市场占有大约3/4的份额,其他还有华为、同方等。联想展示了采用本地供应链的电脑,如高端旗舰的联想开天X1,机身采用碳纤维,重量为990克,续航8小时左右,针对银行管理层定制。
银行客户对电脑有一些定制化要求,其中轻量定制要预制好用户名、密码,包括浏览器收藏夹中的网页。深层次的定制则要针对客户的场景,去兼容一些外设,提前优化和测试Linux系统等。
一位行业人士称,过去这几年,银行在应用这些电脑过程中,花了很大力气解决各类问题。“软件、外设等各类问题,每个季度都有上百个,在几天内都会解决。”他说,“问题会越来越少,其他企业可以复用。”而在下半年,新一轮电脑采购旺季即将到来。
在智算上,由于人工智能的加速发展,头部金融企业在2022年左右,投入智算建设。
从政府部门的要求来看,近日国家发改委、工业和信息化部、国家能源局、国家数据局联合印发《数据中心绿色低碳发展专项行动计划》,要求,到2025年底,新建及改扩建大型和超大型数据中心电能利用效率(PUE)降至1.25以内,国家枢纽节点数据中心项目PUE不得高于1.2。而上海甚至有实时监测数据中心PUE的规定。
政策倒逼原来的数据中心进行升级。而根据相关统计,行业内先进绿色数据中心PUE已降至1.1左右。液冷产品成为一个趋势,市场有急切的刚需,供应商纷纷推出可实现柔性升级的方案。如一个机柜原来是三四千瓦,在面积不变、承重条件符合要求的前提下,加入配套液冷设备改造,可以做到20千瓦。
从硬件平台来看,市场呈现百花齐放状态,基本满足市场需求。伴随应用系统的改造呈现新旧迭代的态势。