根据高德纳(Gartner)最新的魔力象限报告,生成式人工智能(GenAI)的出现正在推动企业更多的采用数据科学和机器学习(DSML)平台,这些平台可以处理传统的机器学习(ML)和新的GenAI用例,该报告发现云巨头正在迅速抢占市场份额。
Gartner对DSML平台的定义是一组集成的库,旨在使数据科学家能够通过低代码或基于代码的方法完成数据科学生命周期的所有。除了帮助清理和准备数据之外,这些平台(运行在Web上或安装在pc上)还允许数据科学家分析数据以理解数据,然后构建和部署ML和AI模型并应用到生产中。
传统的机器学习侧重于结构化数据,如数据库中的数字表,而较新的人工智能方法,如GenAI,则基于非结构化数据,如文本和图像。今天的DSML平台可以处理这两种类型的数据。
Gartner分析师afraz Jaffri、Aura Popa、Peter Krensky、Jim Hare、Raghvender Bhati、Maryam Hassanlou和Tong zhang写道:“支持的机器学习技术范围从经典的回归或决策树到更复杂的深度学习、强化学习和GenAI。”“使用这些技术构建的模型可以用于业务流程中的任务,如信用评分、客户流失预测、预测性维护、推荐和图像分类。”
如今,GenAI推动DSML平台采用的大量增长。Gartner表示,在最近的一项调查中,53%的受访者表示,GenAI需求“将推动2024年及以后DSML平台支出的大幅增长。”然而,构建GenAI产品是出了名的困难,而且GenAI项目的计划数量远远超过最终的GenAI部署量。
Gartner的分析师写道:“对包括GenAI在内的人工智能解决方案的需求激增正处于顶峰,但数据、模型、代码和基础设施等原材料要组装成可信的、可扩展的产品,前所未有的复杂。”
对于GenAI拥护者来说,好消息是DSML平台已经准备好了,并将GenAI带入AI和ML的行列。DSML平台已经开发出构建出各种ML和AI产品的既定流程,新的GenAI工作负载可以从这一进展中受益。
然而,就使用这些工具的角色而言,组织对GenAI的需求与DSML工具将如何实现它们之间存在着一点差距。Gartner表示,这是因为GenAI正在将更多的用户从商业方面引导到数据科学,他们通常没有成熟的数据科学家那么高级的技能。
人工智能的快速发展正在改变人类的角色。Gartner表示,到2027年,50%的数据分析师将被重新培训为数据科学家。与此同时,今天的数据科学家将成为明天的人工智能工程师。
但是也有好消息,根据Gartner的说法,像AutoML这样的特性——软件根据要使用的特性、权重和ML模型做出决策——已经在DSML平台中变得司空见惯。
此外,这些AutoML功能正在与基于GenAI的功能(如编码助手和自然语言查询)相辅相成,这将进一步降低进入门槛,并鼓励数据科学更多普及。
Gartner表示,随着GenAI推动对更多人工智能的需求,并推动更多人进入人工智能业务,DSML平台将发挥关键作用。
Gartner分析师写道:“数据科学和人工智能领导者面临的问题是,如何管理和治理分布式DSML团队的活动,并通过与集中资源的协作,最大限度地提高效率。”
Gartner在其最新的魔力象限报告中表示,云巨头在数据科学和机器学习平台市场上取得了可观的收益。不过由于GenAI的推动和团队间协作的需要,较小的软件公司同样有望继续创新和繁荣。
在最新的数据科学和机器学习平台魔力象限中,亚马逊网络服务、谷歌云和微软Azure都处于领先象限,与之并列的还有Databricks、Dataiku、datarrobot、SAS和Altair。
“由于DSML开发所需的计算、数据和基础设施的可用性”,超大规模产品在DSML平台市场上获得了更多的吸引力。
“然而,其他人仍然有发展的空间,特别是在实现团队之间的协作方面,这是DSML和GenAI开发的一个关键支柱。”作者继续说,“将DSML技术带到更多的企业和企业的每个领域,是供应商和最终用户都可以抓住的机会。洞察驱动型决策的数据科学的基本用例不能在GenAI的热潮中丢失,DSML平台提供了将高级分析和人工智能开发结合起来的完美场所。”
DSML排行榜在短短几年内变化之快令人瞩目。在Gartner目前的领导者象限中的八家供应商中,只有SAS和RapidMiner(现归Altair所有)在2019年进入了该象限。即使在2021年,也没有一家云巨头进入领先象限,尽管Databricks、Dataiku和SAS都进入了领先象限。
在2021年被认为是DSML魔力象限领导者的供应商在执行能力和愿景的完整性方面出现了倒退,包括KNIME、TIBCO、Mathworks和IBM。曾经处于挑战者象限的Alteryx,现在与MathWorks和KNIME一起进入了利基玩家象限。
与此同时,Cloudera已经从2021年的利基玩家象限进入2024年的愿景者象限,与H2O.ai和Domino数据实验室处于同一位置。与此同时,阿里云已经从利基玩家类别上升到挑战者象限,IBM目前也处于挑战者象限。自2019年以来,Anaconda仍然处于利基玩家象限。