作者|桑明强
有关下一代数据智能基础设施的构想,包括对现有IT系统的升级以及通过数据和算力驱动的智能化决策支持,一直是业界讨论的热词。
在新发布的“中国数据分析和人工智能技术成熟度曲线图”,Gartner认为,“数据中台”即将消亡,取而代之的是“数智基建”,这一转变的发生,恰恰源于数智基建与数据中台的本质差异。
与强调“中心化管理”的数据中台不同,数智基建更笃定生态系统的力量。
要知道,现在的企业比以往更加务实,尤其对于一些中大型企业来说,相较于盲目追逐科技风口,他们迫切希望构建起一套灵活且可持续的数据分析和AI平台,用来优化业务流程、辅助决策,而不是简单地把数据搬到线上做一个看板大屏。
映射到今年OpenAI斥资36亿美元收购初创数仓公司Rockset,再联系到Databricks和Snowflake的密集动作,前者去年以13亿美元收购了致力于改进 AI 模型训练方式的MosaicML,后者曾被爆出以逾10亿美元谈判收购人工智能领域的初创公司Reka AI,以上种种迹象表明,数据层和模型层齐头并进几乎成为行业共识。由于To B市场能够快速形成价值闭环,极有可能成为大模型落地的首选。
同样的剧变也在国内发酵。具体表现为以滴普科技为首的Data+AI领域独角兽,正顺应时代发展基于AI与大模型的能力,进行着原有产品与技术体系架构的迭代升级,从最早期的数据中台演进到湖仓一体,再到结合大模型技术演进为To B领域的数智基建。
不过,囿于投资与业务价值不匹配及GPU市场价格的波动,当前大模型行业面临断崖式降温。
但这并非一件坏事,“大模型正逐步改变To B市场的游戏规则。”滴普科技董事长兼CEO赵杰辉说到。在他看来,“通过将大模型与云生态系统相结合,企业和组织可以更好地整合结构化与非结构化数据,这对于数据平台能力的提升将是质的飞跃。”
按照赵杰辉的逻辑,当下大模型在企业的价值场景落地主要有两方面的割裂:一方面,虽然很多数据平台汇聚了海量的实时数据,但缺少灵活的业务上下文逻辑;另一方面,大模型理解能力有目共睹,但缺少实时业务数据反映的业务实时细节。
一定程度上,这也解释了为什么过去两年来,大模型赛道始终处于鱼龙混杂的局面,尽管有不少玩家真金白银的投入了很多钱,用更大的算力训练更多的参数,但在价值场景落地的ROI上却低得吓人。市场上缺乏的,是真正将数据层、应用层、模型层打通合于一体,提供全面数据解决方案的选手。
换句话说,抛开C端市场不谈,如何形成“Data+AI”的整体基础设施和创新应用,让大模型基于企业实时数据和非结构化数据承载的业务逻辑,形成更为深入的业务实时推理能力,构建企业在各个领域的智能应用,才是大模型技术在B端快速落地的关键。
这也是滴普科技能在国内一众数据智能公司脱颖而出的原因。熟悉这家公司的都知道,作为2024新晋国家级专精特新“小巨人”,这家公司向来以低调、不跟风著称,团队核心成员不乏华为老队员,同时也继承了华为在打磨产品、钻研技术上的朴实基因。
与Databricks成长轨迹相类似,滴普科技自成立以来就持续聚焦“Data+AI”战略,从找准定位最早只做底层的数据平台,到打造出实时智能湖仓平台FastData,再到探索出目前国内唯一能实际落地的DeepexiOS企业AI平台,几乎每一步都精准地踩在了数智基建向前发展的浪潮上。
滴普科技DeepexiOS企业AI平台
拿DeepexiOS企业AI平台来说,它是滴普科技在今年服贸会上最新推出的标杆产品,包含FastAGI企业大模型服务平台、FastData企业融合数据平台、Fast5000E企业算力平台三大核心组件,在这个基础上形成的DeepexiGenAI企业生成式AI应用,目前已经在供应链AI快反、工艺AI编制、工程设计AI辅助、数据AI分析等核心领域均有客户落地案例,并通过了工信部中国信通院模型能力标准符合性4+级认证。
“坦白讲,客户并不在意大模型训练了多少参数、准确度有多高,相反的,他们更关心这项技术能带来什么样的实际业务价值。”
赵杰辉以百丽时尚为例,作为国内鞋服零售行业老牌巨头,它在企业数字化建设中最关心的就是能否做到供应链AI快反,有了DeepexiOS企业AI平台后,它能对实时产生的业务数据进行解析,并基于历史数据和当前市场情况,完成科学的补货和生产决策。
事实上,数据治理和模型能力的结合,带来的颠覆程度要远比当年的数字化剧烈得多。
如果说上一个时代主要任务是做数据基础平台建设和数据要素的资产化,“Data+AI”的主要任务就是把各类企业的复杂场景逐一解耦、重构,加上大模型技术与生俱来的易用性,极有可能在市场上掀起一股新的数智基建热潮。
这并不是空穴来风。
根据《IDC MarketScape: 中国实时湖仓市场2024年厂商评估》报告,未来12个月,选择外部合作来构建数据管理服务的企业比例将从58%快速增长至85%。也就是说,随着数据量的快速增长,以及对数据管理需求的升级以及技术架构复杂度和独立开发成本的上升,是否具备拔尖的数据治理能力将是推动大模型产业落地的关键引擎。
我们就以制造行业为例,众所周知,中国是世界上唯一拥有联合国产业分类中全部工业门类的国家,拥有39个工业大类、191个中类、525个小类,具备全球最为完备的工业体系和产业配套能力,囿于其极高的场景复杂度,这意味着它在数字化转型道路上并不轻松。
但就像硬币总有正反面,“着力制造业的数智基建,就像在深海里开珍珠,只有把坚硬的贝壳敲开,才能淘到宝藏。”赵杰辉以滴普科技在某装备制造领域的实践经验举例,整个过程分两步走,第一步先建立起FastData企业融合数据平台,然后基于FastAGI企业大模型服务平台深入剖析生产过程中的各项数据,对现有的工艺流程进行细致的优化与调整,生成更为高效且精确的“工艺卡片”。
这么做的好处很明显,一方面,可以在产品设计阶段可以确保质量控制,避免后期的检测和返工;另一方面,通过标准化和模块化设计,可以缩短每个生产批次的准备工作时间,大幅提升生产效率,最终确保产品质量的一致性和稳定性。
值得一提的是,随着价值场景落地越来越多,数智基建的规模效应也会随之而来。
“当下中国并不缺数据智能和大模型厂商,很多人都抱怨行业不景气,症结在于总想赚快钱,对于一项新技术而言,除了要不断学习和迭代,我们更要搞清楚它究竟能给客户带来什么。”赵杰辉坦言。
某种程度上,尽管生成式人工智能的潜力依然存在很大的不确定性,但有一点是毋庸置疑的,大模型并非传统意义上的AI泡沫,国外的月亮也不一定更圆,其渗透率的增长只是时间问题,就像当年发生在To B圈的中台热潮,它被市场淘汰的背后,有些好的方面仍会保留,甚至以一种新的方式交付到客户手中,最终考量数智基建成功与否,还是要回到价值本身。