阿里云:骑上AI再出发

商业科技场 2024-04-09 01:38:48

撰文 | 王长胜

2023年,AI火遍全球,被视为AI元年。这一年,似乎全球的科技公司都在寻找利用AI开挂的机会,阿里云也不例外。

对于一家成立了十四年的科技公司,技术迭代将是至关重要的转折点——里面可能蕴藏着再度腾飞的历史机遇,也可能埋伏着更快被颠覆的重重陷阱。及时调整战略部署,跟上技术迭代的脚步,不被时代甩下车,是任何一个长期主义者的必修课。

回想2008年9月,阿里集团确立了“云计算”和“大数据”战略,一年后,阿里云计算有限公司正式成立。

什么是云计算?什么是大数据?15年前,没几个人能讲清楚,哪怕是马老师自己。那是一个技术理想主义意气风发的时代,阿里云在国内第一个提出要构建“一朵庞大的云计算”,恰逢移动互联网蓬勃兴起,无数互联网原生企业在阿里云上成长起来。在这个过程中,阿里云也造就了连续10个季度以上同期100%增长的行业奇迹,很长一段时间,业界开玩笑,中国只有两朵云,一朵是阿里云,一朵是其他云。

这些年里,阿里云核心做了一件事情,就是引领并推动中国互联网和各行各业的数字化进程,并且从一开始就坚持公共云优先的技术路线。

然而15年后,随着互联网增速放缓,阿里云急需寻找下一个新世界。AI与云计算结合的滩涂,仍是一片异常开阔的处女地。但阿里云能像历史上那些幸运的巨头一样,成功穿越技术周期,抵达新大陆吗?

不久前的财报会上,阿里表现出对AI和云计算前所未有的投入决心。阿里巴巴集团CEO、阿里云CEO吴泳铭宣布坚决加大对阿里云的持续战略投入强度,让阿里云心无旁骛专注于“AI+云计算”发展战略,为此阿里云甚至暂缓从阿里集团完全分拆,以便能以更大的研发投入面对不确定的市场环境。同时,阿里云宣布了AI时代的全新战略——“AI驱动、公共云优先”。

此时,熟悉阿里集团和阿里云的人已经猜测到了一场即将来临的组织变革。果然,一周之后,11月23日,阿里云宣布了一系列组织架构调整:

成立公共云业务事业部,以规模优先、扩大市场占有率为目标;成立混合云业务事业部,满足一些特定行业因政策限制、短期无法使用公共云的客户需求,重点考核利润,减少项目制的软硬件订单销售;成立基础设施事业部,打造面向未来的软硬一体底层基础设施。

同时,阿里巴巴集团层面还成立了一个基础设施委员会。该委员会由吴泳铭统筹管理负责,重点协调全集团底层技术基础设施的规划与建设,这表明,未来阿里集团各业务与阿里云之间,在底层技术基础设施方面仍将密切联动。

如何理解阿里云提出的“AI驱动”?为什么在拼增长的时候还坚决选择“公共云优先”?从阿里云近期密集动作和高层表述中,可以管中窥豹——AI时代的新蓝图,阿里云已经想好了。最关键的答案,还与启程时那个宏大愿景有关。

为什么一定要用AI驱动?

吴泳铭是阿里巴巴十八罗汉之一,阿里的第一个程序员,阿里创始团队里唯一懂技术的人。“吴妈对技术创新还是很敏感的,他对技术发展的未来方向也有深刻的见解。”一位接近吴泳铭的员工说。

吴泳铭的回归,正值以大模型为代表的AI技术大兴之时,数字世界和现实世界也正在面临着前所未有的深刻重构。计算的范式也同样发生着根本性的变化,AI计算的重要性正在超越传统计算,成为数字世界的基石。

在不久前的乌镇世界互联网大会上,吴泳铭做出一个大胆判断:AI计算将成为整个数字世界计算资源的调度者和中枢神经,并最终接管传统计算资源。以CPU为基础的传统计算,需要在工程师预设的算法逻辑下帮助人类工作,更像我们的“小脑”,而以GPU为核心、各类大模型驱动的AI计算,具备理解人类语言和现实世界的智能,更像我们的“大脑”。

这是我目前所听到的对AI时代的云计算最清晰和形象的表达。一句话,未来的云计算,必须用AI驱动。如果说,云计算是水和电,那么,AI就是能够让水变成自来水,让电变成电网的魔术师。

中国工程院院士、阿里云创始人王坚认为,云与AI的结合,正掀起“云计算的第三次浪潮”。在这场绝不能错失的浪潮中,阿里云的目标显然是成为AI计算的引领者,为千行百业的AI创新和转型提供基础设施。

如今,正处在传统计算和AI计算切换的重要节点上,为了把握住这次历史性机遇,可以看到,吴妈掌舵后,阿里云正在进行一场“由内到外”的深度变革,并且给自己树立了三个Flag。

第一,打造一朵“能自我进化的云”。

过去,云计算中大量部署、运维、故障处理需要依靠人的经验,如今,阿里云正在逐步用AI 技术全面升级云计算体系,加速自身从传统计算向AI计算的转型,在代码开发、系统优化、智能运维、资源调度、客服响应等全流程实现大模型驱动,构建一朵“能自我进化的云”。

前不久的云栖大会上,阿里云发布了超过30款接入大模型能力的云产品,智能编码助手“通义灵码”也初步展示了AI计算的想象力。

第二,打造一套国内最先进的AI基础设施。

阿里云一直有“数据中心就是一台计算机”的理念,即通过云网络的连接让数据中心像一台超级计算机般运转,开发者无需考虑底层问题。今天,AI时代更加需要这样的技术体系,大模型推理比训练更离不开云计算。

打造一张最具竞争力、带来规模效应的公共云计算网络,是阿里云在AI时代至关重要的目标。尤其在中国市场,由于高端芯片进口受限,底层高性能硬件处于相对分散化的状态,AI爆发将更依赖公共云平台来高效连接异构计算资源,通过兼容底层硬件差异,突破单一芯片瓶颈,形成强大的AI云计算引擎。

在AI驱动的新战略下,阿里云所有计算产品正为AI计算而升级,包括打造“为AI而生”的超高性能计算、存储、网络架构,并形成高弹性、低成本、网络密集的公共云服务。

目前,阿里云已成为中国大模型最重要的算力底座。除了通义大模型外,百川智能、智谱AI、零一万物、昆仑万维、vivo等大批企业及机构均在阿里云上训练大模型,并通过阿里云提供API服务。

第三,打造一朵“AI时代最开放的云”。

作为“模型即服务(MaaS)”的提出者,阿里云正在构建开放的AI模型服务生态,加速AI计算上层的应用创新,并已初步建成AI时代全栈的云计算体系。

10月的云栖大会上,阿里云全面升级AI基础设施——人工智能平台PAI,发布了千亿级参数规模的大模型通义千问2.0及8大行业模型,推出一站式模型应用开发平台“百炼”,开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,把更多精力专注于应用创新。

在阿里财报会上吴泳铭表示:“未来,我们坚持做好两件事,一是打造一朵‘AI时代最开放的云’,为全行业提供稳定高效的AI基础设施,支持各行各业智能化转型;二是创建开放繁荣的AI生态。”

为什么一定要“公共云优先”?

亚马逊创始人贝索斯曾这样描述AWS(亚马逊云)的愿景:“学生在宿舍里就能使用与世界上最大的公司一样的基础设施。”

2009年2月,飞天团队在北京写下第一行代码,这是由阿里云自主研发、服务全球的超大规模通用计算操作系统。飞天成立之初就明确提出:“让计算成为一种公共服务”。当时,王坚有三个核心判断:1、互联网是基础设施;2、数据中心是一台计算机;3、计算成为一种公共服务。这背后的核心是基于统一计算资源池,实现弹性和多租服务,即公共云。

但是,公共云在中国发展并非一帆风顺。

与美国三大云计算服务商AWS、微软云、谷歌云均以公共云为主不同,中国云计算市场部分客户更热衷于私有云,认为私有云更安全、可控。

不过,对云厂商来说,私有云意味着要针对每一个客户,建造独立的“房间”,既要当“设计师”——贴身服务做个性化定制,又要当“施工队”——做总集成商。不仅十分耗费时间和成本,无法通过标准化实现规模化效益,更重要的是,算力资源严重浪费。

有数据显示,美国市场上存量服务器规模约为2200万台,60%以上的算力是以公共云模式供给的。中国市场的服务器存量规模大约为2000万台,仅有28%的算力是以公共云模式供给的。

换句话说,中美之间算力总规模相差无几,但是在算力利用效率上却存在巨大差距。为什么会是这样?原因很简单,从资源利用率的角度看,公共云CPU使用率可以高达40%,而私有云的CPU使用率不到5%。

也就是说,国内的计算资源多半被浪费掉了。没有统一的云计算架构,导致算力中心的服务器资产,没有办法被充分调度起来。尤其在面临AI大模型的计算需求时,大任务算力不够用(比如:模型预训练生成),小任务跑不满(比如:AI模型的推理应用)。

这也是为什么GPT这样的创新是在美国上诞生的,原因就是美国有一个庞大的公共云基础,形成了算力统一大市场。

公共云占比差异的另一个直接影响是,造成了中美云计算厂商的规模差距。

据Gartner调研,阿里云在全球公共云IaaS市场排名第三,但份额差距较大。2022年全球公共云IaaS市场中,亚马逊AWS份额39.99%,微软份额21%,阿里云份额7.71%。

不仅市场份额存在巨大差距,营收和利润差距更大。2022财年,亚马逊云科技、微软智能云的营收分别为801亿美元、818亿美元,利润分别为228亿美元、327亿美元。相比之下,中国唯一盈利的云厂商是阿里云,2024财年Q2季度,收入同比增长2%至276.48亿元,经调整EBITA利润从上个季度的3.87亿元,大幅提升至14.09亿元,环比增幅达264%,不过相比海外厂商仍有巨大增长空间。

这里不存在技术路线之争,事实上云计算自始至终只有一条技术路线——公共云。尤其在AI时代,公共云是提供AI时代算力保障的唯一出路。这已经是行业共识。至于私有云,只是阶段性的过渡形态。

2010年7月,美国宇航局NASA和美国IT公司Rackspace联合推出开源软件项目OpenStack私有云,意在与公共云抗衡。两年内,IBM、惠普、Intel、RedHat等传统IT巨头纷纷加入。

但是,十年后的今天,Rackspace自己已从“ALL in OpenStack”转变为“多云”战略,即同时支持AWS、Azure和OpenStack多种云平台;Mirantis(OpenStack圈子里的明星企业)宣布裁员;惠普与思科相继关停各自的OpenStack云;英特尔提前退出了与Rackspace合作的一个OpenStack创新项目;赛门铁克、Juniper退出了黄金会员席位。

过去十年间,美国政府也做出了巨大改变,推进了一系列大型公共云计算的项目,并先行关闭了政府自建数据中心,率先要求CIA、DoD(国防部)、NSA(国土安全部)、NASA等国家关键的部门选择与亚马逊、微软、谷歌等商业云计算公司合作解决可用性问题。

都说云计算是水和电,是基础设施,这让我联想起一段往事。

19世纪末,在电力普及的过程中,发生过这样的情况。当时,美国工厂想要使用电,必须自建发电站。这种方式解决了电力的使用问题,但成本高昂,利用率低,而且一旦工厂倒闭,发电站也就彻底报废。直到1882年,托马斯·阿尔瓦·爱迪生,在美国纽约珍珠街建设了拥有6台发电机的发电厂,将发电站合并在一起。从此,电才成为公共服务,拥有了更强的灵活性和更大的规模效应。如今,电网成了所有国家的标准配置,电力成为人类生活、社会经济发展的基础设施。

这是不是像极了今天的公共云和私有云?历史发展就是这样一个不断复制粘贴的过程,然后以一副看似全新的姿态继续前行。

后记:归来仍是少年

兜兜转转,阿里云又回来了。

从成立第一天开始,阿里云人就坚信,计算是一个社会最基础的公共服务,就像电一样。

作为公共服务,作为基础设施,盈利能力重要吗?当然重要。但不是最重要的事情。最重要的是,用高品质的服务惠及社会中的每一个人,并且推动社会的进步。就像电一样。

“减少项目制销售订单,加大公共云核心产品投入”,在我看来,这是一个相当明智且正确的决定。且不说项目制销售订单利润率低,单就它的价值普适性而言,更像是头痛医头脚痛医脚的财务行为。

这些年,阿里云拖着中国云计算行业前行,同时也渐渐被行业发展所裹挟。初心,就变得愈发珍贵。

何为初心?云栖大会有个口号,为了无法计算的价值。我很喜欢这句话,真正有价值的事物,往往是无法计算的。对于阿里集团而言,阿里云的价值,也是无法计算的。

马老师早年就说过,阿里巴巴就像是坦克车的履带,一节带动一节,老业务孵化新业务,新业务带动老业务,接力前行。从最初的B2B业务,后来孵化出淘宝,然后是支付宝(现已分拆独立成蚂蚁集团),再之后是天猫、阿里云、菜鸟、阿里国际……直到“1+6+N”。每个阶段,都有一个带头大哥,为大家提供能量和养分。虽然,现在已经逐步走向独立,但是作为阿里体系里的成员,协同性与联动性还是有着相当大的优势。

在AI携大模型横空降世之际,阿里云的价值似乎也被瞬间点燃,成为家族众多兄弟姐妹中可堪大任的那一个。

阿里云回来了。一如当初那个少年。

0 阅读:0

商业科技场

简介:感谢大家的关注