2023年,堪称“生成式AI元年”。随着ChatGPT的大火,各类大模型的推出,以及更大规模的商业化应用,人们前所未有地把目光聚焦到AI领域当中。而近年来,东南亚各国的数字经济渗透率不断提高,也让人们看到了AI在东南亚大有用武之地。而广阔的市场前景,也让大厂纷纷押注。
生成式AI在东南亚大火,大企业提供技术支持
2024年伊始,国际领先科技公司相继在东南亚推出了新的AI动作。
2024年1月30日,阿里云在新加坡举行了AI&大数据峰会,并推出了PAI(Platform for AI)-EAS(Elastic Algorithm Service)的无服务器版本,旨在为个人和企业提供灵活的人工智能算法部署和推理解决方案。相较于传统定价模型,PAI-EAS推理成本可降低50%。同时,阿里云还宣布将其最新向量引擎技术集成到更多产品中,包括数据仓库Hologres、搜索服务Elasticsearch和OpenSearch,使企业更容易访问各种大型语言模型(LLMs)并构建定制的生成式AI应用程序。
阿里云新加坡举行了AI&大数据峰会
与此同时,新加坡电信Singtel宣布将逐步关闭新加坡五个较老的数据中心,以转向构建更环保、更AI化的数据中心——Nxera。另一边,新加坡企业发展局也与一全球巨头联手,计划在未来三年内帮助100 家新加坡生成式AI初创公司在未来三年内实现产品开发与商业化。
由此可见,由ChatGPT在2023年掀起的AI热潮延续到了2024年,且有进一步在东南亚蔓延和渗透之势。根据Statista的数据,2022年东南亚AI产业的市场规模为326.4亿美元。预计至2030年,这一数字将增长至5808亿美元。与此同时,生成式AI在东南亚的市场规模也出现大幅增长,从2022年的6.3亿美元增长至2023年的14.1亿美元,预计至2030年将增长至76.5亿美元。
东南亚风险投资机构AC Ventures创始人Adrian Li曾向7点5度表示,“虽然东南亚AI产业仍处于起步阶段,但整体在不断发展。新加坡、马来西亚、印尼和泰国等国家已成为AI创新的热门市场,投资者已经开始在这些市场配置更多资金。” Adrian Li还强调称,“虽然东南亚的行业仍处于早期阶段,但它有潜力成为全球主要的AI市场。”
相比阿里云、OpenAI、谷歌等有自主研发AI大模型能力的大企业,东南亚初创型AI企业也在近年来崛起,比如提供人脸识别、数字身份验证乃至风险管理评估等多种服务的ADVANCE.AI,聚焦语音与自然语言处理的AI Rudder与WIZ.AI,为电商零售行业提供图像识别技术的ViSenze,提供多领域应用AI解决方案的Sentient.io等。
随着国际巨头的押注以及本地公司的加码,东南亚的AI生态正日趋完善。而且,由ChatGPT带来的生成式AI热潮,让东南亚市场看到了生成式AI在更广泛的商业应用的巨大潜力,成为了更多的东南亚初创企业的创业选择。比如,东南亚也出现了一些“山寨版ChatGPT”公司,或者调用ChatGPT API作为引擎的AI产品,它们通常采用订阅制、付费使用和定制化方案等商业模式。而这些初创公司的产品也涉及多个领域:如用于政策公文撰写的GreatGov GPT,如用于航运通信管理的SeaGPT,如写作助手LovinBot,广告制图工具Pebblely等。
但不可否认的是,很多东南亚AI产品还处于相对初级的阶段,需要通过成熟的大模型进行赋能。面对东南亚技术与基础设施领域的短板,拥有技术优势的AI巨头可从大模型、芯片硬件与云服务等方面切入。
阿里云智能海外业务事业部总裁袁千在AI&大数据峰会上表示:“我们全球客户对AI技术的需求日益增加。通过向社区开源我们的大语言模型,我们可以提供强大的计算解决方案和尖端的人工智能创新,支持客户开发定制的生成式AI应用,帮助他们能抓住生成式AI领域的机会。”
阿里云智能海外事业部总裁袁千
聚焦语言模型,发力东南亚AI最大领域
从细分领域看,目前东南亚AI产业市场中占比最大的是机器学习与自然语言处理。2023年,东南亚AI市场中机器学习领域的市场规模达到50.3亿美元,自然语言处理为7.1亿美元,预计到2030年,机器学习的市场规模将增长至191.1亿美元,自然语言处理将增长至23.4亿美元。
而在东南亚这样多国家、多民族、多语言的地区,自然语言处理要面对多样的小语种且多变的口音,整体操作要复杂得多。聚焦东南亚市场的AI Rudder在做海外市场调研时发现,绝大多数的公司(不管是中国,还是美国)虽然有很多很强的语音识别技术,但它们却没有很好地去服务小语种。“其实这个'小’也不是特别小,比如印尼已经有3亿人口,但我们都没有一个非常好用的语音识别引擎,市面上大部分还是欧美厂商提供的语音识别技术。” 该公司创始人&CEO 任腾和7点5度分享道。
另外,国际上大多数AI语言大模型来自西方国家,主要依靠英语或其他欧洲语言的语料进行训练。但在东南亚,即使是新加坡这样的英语国家,也需要本土化的语言模型。WIZ.AI联合创始人兼CEO Jennifer Zhang告诉7点5度,新加坡英语不仅有着独特的中式潮州发音方式,还有着极度简化且抛弃严格英语语法规范的语言模型。像新加坡英语这样的东南亚语言使得语音识别、自然语言理解等需要全新的训练模型。
想要在东南亚AI市场占领一席之地,必须要有符合东南亚语系的语言模型。于是,阿里巴巴达摩院在2023年12月推出了首个基于东南亚语言训练的人工智能大模型版本SeaLLM,以及名为SeaLLM-chat的聊天版本,支持东南亚地区大多数官方语言,包括泰语、越南语、印尼语、马来语、老挝语等。
SeaLLM使用东南亚语言理解科学、化学、物理以及经济学等多种学科,在语料层面优于大多数开源大模型,使得其模型在理解东南亚语言方面更加精确。与SeaLLM长期合作的南洋理工大学计算机科学与工程学院 (SCSE) 助理教授Luu Anh Tuan表示,SeaLLM大模型的推出可能为使用英语和汉语以外语言的人带来新的机会,还可以帮助企业更深度地参与东南亚市场,并构建自己的聊天机器人助手。
此外,新加坡国家人工智能计划AI Singapore也正在研发名为Sea-Lion的大型语言模型(LLM),该模型正在由印尼电商平台Tokopedia和新加坡IT公司NCS等公司进行测试。Sea-Lion是一个人工智能模型,能够理解和生成类似于人类语音或对话的内容。Sea-Lion的目标是在培训中理解并生成涵盖该地区多样语言和文化的输出内容。
相比之下,大模型的开源生态似乎有着更明显的优势,可深入赋能东南亚中小企业。2023年12月,阿里云AI大模型通义千问持续开源了更多模态的大语言模型,包括预训练的音频理解模型Qwen-Audio及其会话微调版本Qwen-Audio-Chat。
Qwen-Audio可以理解各种格式的文本和语音信号,包括人声、自然音和音乐,并输出文本。它能执行30多种音频处理任务,如多语言转录、语音编辑、音频摘要与分析等。其会话微调版本Qwen-Audio-Chat可支持基于音频的多轮问答,并可执行多种面向音频的任务,如感知人声的情绪和语调。阿里云首席技术官周靖人曾表示:“开源生态对推动大语言模型发展和AI应用落地至关重要。我们希望成为最开放的云,让每个人都能享受生成式AI的能力。为此,我们将继续分享前沿技术,与合作伙伴共同促进开源社区的发展。”
值得一提的是,阿里云去年还对其整个数据库解决方案进行了提升,包括云原生数据库PolarDB、云原生数据仓库AnalyticDB和云原生多模型数据库Lindorm,集成了专有的向量引擎技术,以显著提高性能和功能。向量引擎将文本和数据转换为高维空间,通过以复杂而高效的方式嵌入大量结构化和非结构化的上下文,优化了AI性能。这有助于简化相似性比较和语义分析等任务,尤其有益于大型语言模型(LLMs),推进各种先进的AI功能。据悉,WIZ.AI也利用了阿里云广泛的AI服务,构建了其可立即集成、安全智能的Talkbot解决方案。
面向未来的AI产业,人才培养是关键
AI领域作为技术密集型的产业,人才是技术发展的动力。而让AI在东南亚实现更加本土化的技术发展与商业应用,本地化的人才与研究更是关键。
2023年12月,新加坡宣布了《国家人工智能策略2.0》,列出了新加坡未来3到5年的15项新规,其中包括针对AI的培训计划、AI专用的物理空间以及为数据中心分配足够的碳预算等。新加坡还致力吸引全球顶尖AI创造者并培养本地AI人才,力图将本地AI从业者人数增加两倍以上,达到15,000人。
事实上,在东南亚国家当中,泰国在AI领域也有相当的竞争力。与新加坡一样,泰国也将本地人才培育列为国家AI战略的计划之一。根据Oxford Insights评估的AI政府准备指数排名当中,在被评选的181个国家中,泰国排名第31位,在东南亚排名第三,仅次于新加坡和马来西亚。与新加坡一样,泰国也在2022年发布了《泰国国家人工智能战略与计划(2022-2027)》,该计划的核心目标包括建立数据中心,以及到2027年至少培养3万名AI相关的人才,其中包含200-300位的AI专家的人才培育目标。
近年来,阿里云与东南亚高校展开人才计划,例如与新加坡南洋理工大学启动博士生培养,与泰国玛希隆大学共同培育本地人才等。去年12月,阿里云还与泰国朱拉隆功大学学术资源办公室合作开设了全球首家阿里云国际Skills Center,为朱拉隆功大学的学生和公众提供免费培训课程、认证训练营、人工智能主题竞赛和领导力发展计划,通过培训项目和社区活动,培养新一代数字人才。
除了阿里云,英伟达也与泰国CMKL大学开始部署NVIDIA DGX POD和AI软件硬件服务商DNN提供的系统进行AI超级计算和研究,以支持机器学习、互联和自动化运输、食品和农业分析以及健康等领域的研究。
相比较技术发展更为先进的新加坡,泰国AI产业的发展还需要基础设施的提升与人才培养,而这也离不开各大AI企业的技术积累以及经验。而随着像阿里云这些的大企业越来越深度地参与东南亚AI产业的发展,这些大企业也将凭借其技术实力,推动泰国以及东南亚其他国家在AI与数字化基础设施的发展,同时也将为下一代本地AI人才的培养与发展提供平台。