文|刘雨琦
编|王一粟
“今年8月份以后,有非常多企业客户开始咨询智能化的服务,也提出一起共创。”ChatGPT火爆之后的半年,帆软BI产品运营负责人唐昕开始感受到了来自市场对智能BI的强烈需求。
商业智能BI是一套完整的由数据仓库、查询报表、数据分析等组成的数据类技术解决方案。越来越多的企业也意识到BI的重要性,据Gartner 2023年在中国区进行的调研表示:62%的中国CIO将在2023年增加商业智能BI的投资。
从报表式BI到敏捷式BI,中国BI经历过第一波周期,走向低门槛、可视化,让业务人员能够快速托拉拽自定义用数,同时也将后端分析能力搬到台前。
在光锥智能与多位BI厂商交谈的过程中发现,几乎所有业内人士都认为,智能BI是下一个阶段。但从具体动作来看,目前厂商的态度却大概分为两派:
一派是行动派, 在ChatGPT出现以后,迅速接入能力开始尝试,如思迈特新版本中着重提到了智能对话能力,网易数帆也在押注ChatBI、百度GBI在内的巨头公司也开始向智能BI进行探索和尝试;
另一派则是冷静派, 仍然在保持观望态度和内部探索,并没有迅速上线产品。
“沿着旧地图,找不到新大陆。” 思迈特软件CEO吴华夫认为发展智能BI不破不立;网易数帆大模型技术负责人、人工智能产品线总经理胡光龙同样认为:“智能化将极大降低BI用户使用门槛,真正做到人人用数的阶段。”
但帆软FineBI产品运营总监唐兴强却认为:“智能化对BI的影响更多在提升效率的环节,核心还是要结合当下场景进一步分析。”
在如同冰与火的对立之下,中国BI行业也在争议中,再次进化。
智能BI长什么样?智能化席卷着千行百业,但究竟会带来哪些具体的改变,任何一个行业都还没有定论。
“大模型+BI,从交互式体验,到编码能力再到推理能力,要一层层叠加到业务里去”,网易数帆大数据产品线总经理余利华向光锥智能分享道。
用交互式能力降低“用数”门槛,是智能化的第一阶段。
从微软PoweBI开始,对话式BI成了大模型+BI的第一站。国内BI厂商也在今年8月开始动了起来。
思迈特在最新V11版本的产品中,加入了数据模型、指标模型、自助分析、对话式分析等多种智能角色能力,另据光锥智能独家获悉,思迈特不久也将推出问答式BI;紧接着网易数帆发布了有数ChatBI产品,将基于大模型的自然语言理解能力与专业数据分析能力结合;10月份,押注AI应用的百度也将触角延伸至BI领域,推出其生成式商业智能产品“百度GBI”,可以通过自然语言交互,执行数据查询与分析任务,并且支持专业知识注入。
对话式BI,即用户通过自然语言即可与BI系统进行交互。当对话式BI介入后,查找数据的流程被简化为,自然语言询问—自动转化为SQL语言—自动搜索数据—转化为自然语言—输出结果。
这种交互方式最大的特点在于大幅度地降低了BI系统的使用门槛,让业务人员无需掌握SQL等专业语言,也无需深入分析模型,即可获得所需。
但随着企业深度使用体验,对话式BI即问题也暴露无遗。例如,搜索过程中,出现了多次搜索数据结果不一样;因统计口径不一致,指向同一个指标的数据无法合并同类项,导致了GMV无法与成交金额一起纳入统计。
诸如此类问题,在实际应用中层出不穷,也逐渐让企业意识到:对话也只是一种形式,而非一种结果。单纯的搜索并不能保证数据得出的合理性,要防止数据变成“无源之水”,还得增加分析的过程。
于是,用推理能力打破分析壁垒,开启了智能化的第二阶段。
智能分析简单来说,就是BI系统能主动识别问题,进行根本原因分析,并给出解决方案建议。这背后需要BI系统积累大量的领域知识及复杂推理能力。以爱数为代表的部分厂商,正在发力知识图谱和大模型,朝这个方向尝试。
爱数产品副总裁李基亮告诉光锥智能,“只有通过知识的方式,才能在技术上做关联分析。”
比如当数据统计口径不一致时,需要大模型的理解能力理解相近意思的数据,并进行整理和归类。举个简单的例子:统计公司本科以上的员工,这不是关键词的筛选而是理解本科、硕士、博士三种具体的学位。
而在分析层,传统的BI软件能够显示数据异常的波动,比如10月份销量低迷,智能分析能够通过回归分析模型,对于每一步的数据搜索、分析过程清晰可见,结果归因层层下钻,逐一拆解,再通过ChatBI展示影响因素是品牌、客户还是渠道。
再向前展望一步,通过智能体重塑BI系统,或许是智能化的第三阶段。
Agent概念最近大火,未来,也许可以达到万物皆可Agent的状态,BI+Agent也将成为其中一个细分方向。
以光锥智能观察,Agent对BI行业的改造已经开始,有从业者告诉我们:“BI目前是Agent化改造的第一梯队”,究其原因在于BI系统里本身就含有大量需要自动化的步骤和流程,这与初级阶段的Agent十分适配,既能简化流程,提升效率,还能提升调用大模型的基础能力。
未来,更进一步,当Agent变得更聪明后,一切过程化将被Agent内化为己有。到那时,无论是单智能体还是多智能体都将不在依赖于线性的程序和规划,对BI行业带来的结果可能是,系统的界限被打破,服务模型将被重构。
Agent直接与用户产生互动,用户通过语音或文字,描述业务问题,大模型理解问题场景,自动识别相关数据源,进行分析并输出结果,完全无需搭建BI系统。
这种“BI+Agent”的新模式,也被业内的一些人视为可能的终点状态。
智能化,为时尚早么?大模型蒙眼狂奔了一年,也让行业看清了一个现实“智能化不是万能解药”,甚至现在很多行业数字化水平都尚浅,从根本上缺少智能化的基础。
唐昕表示:“智能化对BI的影响更多在提升效率的环节,核心还是要结合当下场景进一步分析。”
这一思路和网易不谋而和,网易数帆大数据产品线总经理余利华认为:“如果BI仅仅叠加了大模型,但不能落地、没有场景,就没有价值。”
反观当下BI行业所面临的痛点,并不仅仅是技术难题,简单的讲,并不是智能化缺乏落地场景,而是整个BI行业都面临着场景落地的阶段性难题。
不少客户反馈,大模型生成的分析代码质量参差不齐,准确率难以保证。帆软表示,这就要求BI厂商对领域场景有足够理解,进行细致调教。否则用户体验反弹,信任难以建立。
如何理解场景?唐昕举了一个例子,BI软件具体应该形成什么样的指标,如何能让业务用起来,如何分析产生数据价值,都需要深入行业梳理。
以制造业为例,在制造业里“不良率”是一个重要指标,那么BI介入之后,首先,需要根据行业认知,去确定“不良率”的特征标准,然后才可以把这一特征揪出来,放到指标库里,通过标准化产品实现复用。
在这一阶段,BI性能越高就能行业通吃,这就需要把行业经验吃透,沉淀出指标来。毕竟,金融级的BI要求的是数据敏感,而制造业就不要敏感、需要稳定,行业的经验往往不能照搬迁移。
因此,对于所有BI企业而言,在进入一个新行业之时,企业们又回到了相似的起跑线上。
从行业开拓的角度来看,BI企业开始步入新一轮探索阶段,寻求其他更复杂更边缘行业的落地机会。
BI发展多年以来,率先在金融、电商、零售等行业落地。例如,网易数帆基于金融机构面临的监管加强、价值体现难、数据质量不足、开发资源紧张等挑战,对于金融机构进行数字化建设,包括数据生产力的提升,其内涵涉及合规、增值(为管理、运营人员等提供即开即用的数据)、可信(业务人员信得过数据及平台,打破数据壁垒)、协同等。
在舒适区探索趋近于饱和之后,BI行业正在向外探索,例如农业、制造业等数字化程度较低、专业性的行业,成为了下一个阶段BI探索与争夺的目标。
而在解决这些痛点难题之后,智能化更多的作用集中在“辅助”和“增强”的环节。以爱数客户为例,他们在大模型等支持下解决了数据标准化、业务术语统一等问题,从而提升下游分析建模效率达30%以上。
不过,“智能化”也并非开挂。
尽管市场上已经出现了各种智能BI的概念与尝试,大到行业领导者,小到新晋创业团队。但产品落地后,用户普遍反映智能化的效果并不尽如人意。原因在于,智能BI并不是简单架接一个通用型大模型即可高效运转。
未来中国BI,智能化只是其中一个可能路径。但必须要强调的是,目前无论是国外PowerBI还是国内的诸多BI厂商的调研来看,客户对于智能化的需求并不强,多半抱着猎奇的心态,感兴趣但不会真的为其买单。
更为关键的是如何从客户场景、行业痛点中汲取经验教训。这是中国BI企业在新一轮应用探索中必须面对的选择。
要求数据能力更高,行业重新洗牌智能化虽然不是开挂,但也确实激活了相对固定的行业格局。最为典型的特点便是今年以来,老选手们奋力创新,新选手们也在排队入场。
不止百度这种大厂开始发力GBI(生成式商业智能产品),SaaS厂商开始下探PaaS层,数据库企业也基于AP的分析能力对外向企业提供BI服务,一时间,BI成了数据产业链的交叉点,整个行业格局也面临着重新洗牌。
智能化对数据能力要求的进一步提升,让更底层的数据厂商积累的能力,得以在大模型时代释放。比如,针对大模型在产业中落地存在着数据层的关键难题——幻觉问题、不可解释性、安全风险等等,爱数方面认为,这并不是大模型的问题,而是数据问题。
数据厂商的基础能力,也是BI智能化的下一阶段所需要的核心能力。
比如,企业中常年存在的“数据孤岛”问题,无法实现数据的有效连接和统一查询利用。而且,多个系统中存在重复和冗余的数据,造成存储和计算资源浪费。同一数据在不同系统中存在不一致版本,数据质量无法有效控制。
这会严重影响分析结果和准确性,这不是上一个系统、换一个工具、买一些SaaS产品局部诊脉就能解决的问题,企业需要系统性的、全局性的BI产品。
为了打通多种数据源,爱数在数据管道、数据湖仓一体方面进行了探索,也将这样的探索应用在了RGA(检索增强)技术中,在大语言模型推理生成答案时,额外检索调用外部的领域知识网络,利用综合检索结果进行答案生成。
而智能化产生的新需求对底层的数据能力提出了挑战,这正是全链条工具储备的一个新牵引力。
李基亮举了一个很现实的例子:“现在我们很多客户都是几百TB以上的数据,那平台的搜索能力、对元数据的备份能力、对勒索病毒的抵抗能力,这些很基础的平台能力如果没有,那建好了分析也是空中楼阁。”
“所以现在不是AI+Data,而是Data+AI。”李基亮强调。
虽然基础工作繁琐,当智能分析一旦跑通,将成为新的生产力方式。
企业服务往往靠的是经验型产品和服务,行业格局也会更依赖于先发优势和客户突破能力,也正是因此,短时间内,后来者很难颠覆帆软Top1的地位。
智能化作为生产力之后,客户的选择更多,也可以通过智能化把需求重新做一遍,这让行业有一个了新的弯道超车的机遇期,甚至像百度这种基本没有涉足过BI行业的大厂,也能通过一些AI原生的能力切入中小企业,满足不同群体的不同诉求。
智能化为BI开启了一扇新的窗口,同时,也将带着厂商走入新的竞争格局。