2023年,可以称为AI元年,在这一年,关键技术的突破,如前沿算法的优化、学习效率的提升以及大语言模型的创新,共同推动了AI的能力跃升至新的高度。
在这场全球范围的AI竞争中,中国正以惊人的势头崛起,近日,最新发布的《博鳌亚洲论坛创新报告2023》揭示了一个真相:截至2023年6月,中国AI大模型专利数量占比高达58%,成为AI大模型专利最多产出国。
中国在AI大模型专利方面的突破和领先,不仅为中国人工智能技术的发展和应用提供了坚实的基础,更显示出中国在人工智能领域的强大硬实力。
中国成为AI大模型专利最多产出国
据《博鳌亚洲论坛创新报告2023》显示,全球创新新格局形成是以亚洲、北美、欧洲构成的“大三角”格局,亚洲创新地位进一步强化和稳固。
其中,亚洲在新一轮科技革命的主要技术领域正在赶超欧美,亚洲各国的创新数量、质量及产业化水平处于加速提升的趋势。中国在生命健康与生物制药、新能源和低碳技术、新材料与先进制造、数字智能技术等领域的技术创新数量和质量均位居世界前列。
随着以ChatGPT为首的生成式AI以迅雷不及掩耳之势,引爆了全球人工智能产业的浪潮,报告指出,亚洲已成为AI大模型技术的主要产出区,而中国更是成为AI大模型专利最多产出国。
数据显示,截至2023年6月,中国AI大模型专利数量占比高达58%,韩国占比为8%、日本占比为5%,这两个国家也是亚洲专利的主要产出地区,而美国的占比为18%。
可见,中国大模型表现出强劲的增长势头,就连马斯克也早有言在先,称中国会是AI领域顶尖国家之一,有潜力成为第一。
值得一提的是,伴随AI技术基础性、前沿性和颠覆性的战略位置愈发凸显,百度、腾讯、阿里、华为等国内企业早已成为成为AI专利贡献的“主力军”。
从AI大模型企业创新主体的申请量排名来看,百度、腾讯、平安科技、阿里等创新主体位居前四位,专利申请数量均突破400件,百度、腾讯等专利授权量均突破100件。
中国科技企业成为AI专利贡献主力军
现如今,以百度、腾讯、阿里等为为代表的大模型头部企业,通过不断的技术创新和专利积累,正加速推动我国大模型生态的构建和发展。
比如百度,在AI领域的深耕始于十年前,通过百度研究院、Apollo计划、AI芯片“百度昆仑”等多个多项重要举措,不断推动AI技术的发展。
特别是百度飞桨(PaddlePaddle)开源框架的发布以及基于文心大模型的“文心一言”在2023年3月16日的推出,进一步展示了百度在AI技术领域的硬实力。
目前,文心一言大模型已迭代升级4.0版本,在理解、生成、逻辑、记忆四大能力上均有显著提升," 综合水平与 GPT-4 相比毫不逊色 "。
不过,百度并不是唯一一家在大模型发力的企业。去年,腾讯推出了混元大模型,其拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力以及可靠的任务执行能力。
相比于业界其他大模型,腾讯混元大模型最大的特点,就是从第一个token开始从零训练,腾讯混元大模型掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。
比如在基础设施方面,腾讯采用基于云星星海自研服务器的新一代HCC高性能算力集群,搭载了超强算力GPU,性能提升了3倍。
而算力集群所基于的网络底座——星脉,具备业界最高的3.2T通信带宽,可以为AI大模型带来10倍通信性能提升。通过自研TiTa协议和自研TCCL通信库,星脉网络可将网络利用率从普通以太网的60%提升到90%以上,极大提高整体集群的算力利用率。
根据验证,腾讯新一代计算集群可以帮助混元NLP大模型训练在同等数据集下,将训练时间由50天缩短到4天。
而不久之前,阿里云也正式发布了千亿级参数大模型通义千问2.0。目前阿里云上超过30款云产品已接入大模型能力。
与此同时,阿里云已先后开源通义千问140亿参数模型Qwen-14B和70亿参数模型Qwen-7B。目前这两款大模型均已在ModelScope魔搭社区上线,并可免费商用。
中国大模型繁荣背后是中国科技企业对研发的持续投入,根据全国工商联发布2022年民营企业研发投入数据显示,腾讯614亿元、阿里538亿元、百度233亿元,位列前三。
在持续不断研发投入下,阿里、腾讯等企业将继续发挥其技术优势和创新能力,推动AI大模型技术的持续发展和进步。而随着AI技术的不断演进和应用场景的拓展,中国在AI大模型领域的领先地位将更加稳固。