2023年7月6日,顶级学术期刊《Nature》刊载了华为云盘古气象大模型的最新研究成果论文,这是中国科技公司作为唯一署名单位发表的首篇《Nature》正刊论文,引发了国内外人工智能产业界的广泛关注。盘古气象大模型实现了人工智能在气象预报领域的重大突破,对比传统方法其可将预测速度提升10000倍,并能够提供秒级的全球气象预报。
人工智能大模型是当前科技领域炙手可热的新赛道,也是各国争相抢占的科技创新高地。根据科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》,我国研发的大模型数量排名全球第二。
业内观点认为,大模型不仅要会写诗、画画,更需要能够与实体产业结合,服务千行百业,这也是中国科技企业在在新一轮人工智能浪潮中突围的大方向。
“百模大战”下,AI深入千行百业成突破口《中国人工智能大模型地图研究报告》统计,我国10亿参数规模以上的大模型已发布79个,国内人工智能大模型进入“百模大战”时代。深耕行业,用大模型加速千行百业的数字化、智能化转型,已经成为产业共识,也是大模型赛道的突破口。
近年来,行业知识与大模型能力的结合,正在为越来越多行业带来显著的变化。以华为云2021年发布的盘古大模型为例,目前已经针对矿山、药物分子、气象、政务、金融、制造、轨道等领域推出众多行业大模型和能力集,正在为众多传统行业带来巨变。
在气象科学领域,此前的AI气象预报方法面临精度低、可解释性差、极端天气预测不准等挑战。华为云盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,其采用3D高分辨率AI气象预报方法,能够在秒级时间内完成全球一个小时到7天的天气预报,包括位势、湿度、风速、温度、海平面气压等,而且预测速度相比传统数值方法提升10000倍。
2023年5月,盘古气象大模型提前五天预报出台风“玛娃”的转向路径。2022年8月,盘古气象大模型预测台风“马鞍”的轨迹和登陆时间,准确率达90%,远超行业平均水平。
在药物研发领域,人工智能大模型已经打破了过去数十年的“双10定律”(新药研发平均成本超过10亿美元、研发周期大于10年),大大加速新药研发上市进程,造福人类健康。
华为云盘古药物分子大模型通过学习自然界中17亿个化合物分子,生成了1亿个全新的小分子化合物,可以将先导药物研发周期从数年缩短至一个月,研发成本降低70%。基于盘古药物分子大模型,西安交通大学第一附属医院刘冰教授团队研发出一款超级抗菌药Drug X(肉桂酰菌素),它是一种能够对抗超级耐药菌的广谱的抗生素,也是全球近40年来首个新靶点、新类别的抗生素。
在煤矿行业,大模型正在改变千百年来辛劳危险的井下作业面貌,让更多煤矿工人穿西装打领带工作。盘古矿山大模型仅一个大模型就能覆盖煤矿的采、掘、机、运、通等1000多个细分场景,帮煤矿企业构建少人无人、安全高效的智能化系统。目前盘古矿山大模型已经在全国 8 个矿井规模使用。
在铁路领域,大模型正在让铁路货运更安全。过去货车轨道安全检测全靠人工肉眼进行故障识别,不仅劳动强度大,还很容易产生疲劳造成误判。盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,可将工人劳动强度下降95.75%,提高了货车运行安全性。
中国发展大模型,需要国产化算力与根技术创新大模型时代,各行各业对算力需求的增长远远大于实际算力供给。而且,在复杂的国际竞争格局下,先进算力严重供给不足,已经成为国内大模型发展的首要挑战。这也再次为中国科技界敲响了警钟:中国的大模型发展需要国产化算力与AI根技术的全面自主创新。
在7月7日的华为开发者大会2023(Cloud)上,华为云发布了盘古大模型3.0和昇腾AI云服务,继续深耕AI for Industries战略,并围绕昇腾AI云服务打造世界AI另一极。在大模型的设计思路与发展模式上,华为云盘古大模型与昇腾AI云服务等一系列AI根技术的组合,探索出一条让大模型更快落地的路径。
在模式设计方面,盘古大模型在行业内首创了分层解耦设计,目前已经形成了L0基础大模型、L1行业大模型、L2行业细分场景大模型以及一致的能力集在内的完整架构,为大模型深入行业开创了一条快速通路。比如在行业能力方面,华为云既可以提供政务,金融,制造,矿山,气象等行业通用大模型,也可以基于行业客户自有数据,为客户训练专有大模型。
在大模型之外,如何借助软件平台与云服务降低模型开发门槛,提升大模型训练、推理、部署的效率,成为产业界关注的焦点。以昇腾AI云服务为代表的众多AI根技术,是华为云希望在大模型时代打造的AI另一极。通过软硬一体的平台架构和丰富的云服务,昇腾AI云服务可以让大模型训练和推理更高效、更稳定,并提升大规模并行训练能力。
比如在算力方面,华为云将AI算力资源通过云服务的方式对外赋能,构建了以鲲鹏和昇腾为基础的AI算力云平台。目前,单集群2000P Flops算力的昇腾AI云服务已经在华为云乌兰察布和贵安AI算力中心上线。让企业可以像使用云服务一样,低成本高效率、按需使用充沛的AI算力,快速迭代自己的大模型。
此外,华为云旗下异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等AI根技术,则为大模型开发和运行提供分布式并行加速、算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。
谈到盘古大模型的发展方向,华为常务董事、华为云CEO张平安认为,“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。盘古为行业而生,我坚信大模型将重塑千行百业。”
END