导读:商汤AI大装置有两大作用:解决AI落地中的长尾问题,批量打造大参数模型。
当AI技术广泛渗透进各行各业和日常生活,AI越来越被“祛魅”化。
AI随处可见,但远没有达到无所不能的阶段,有时候还挺“傻”的。大众更愿意接受实实在在的生活改变,而不太关心通用人工智能(AGI, Artificial General Intelligence)等太遥远的概念。
近两年从国外火到国内的通用大模型,成为全球AI头部企业不约而同的发力方向。这些大模型在尝试解决小样本长尾应用等实际问题的同时,也引发了业界关于AGI的重新讨论。商汤推出的AI大装置也不例外。
不久前在2021WAIC(世界人工智能大会)上,商汤科技联合创始人、首席执行官徐立首次分享了商汤新型人工智能基础设施——SenseCore商汤AI大装置的全貌。在商汤内部,AI大装置被定位为商汤长线核心竞争力、公司持续经营和实现更大规模跃迁的护城河。
商汤AI将大装置描述为:将算力、算法、平台这三大最重要内核要素打通为“三位一体”的AI基础设施,实现AI技术对企业服务、城市管理和个人生活三大落地方向的持续赋能,从而以更高效率更低成本进一步带动AI产能的创新升级。
从长远看,通往通用人工智能之路,AI大装置也许是个探路石。然而更关键的是,AI大装置可以解决AI落地中的长尾问题,批量打造大参数模型,加深平台型AI公司的护城河。
趋势:万亿参数来袭,大模型有大智慧AI大装置的名字来源于高能物理中的粒子对撞机,其通过随机的两束粒子流的高速碰撞去认识量子粒子的新规律、新粒子。粒子碰撞结果不可预测,但只有通过不停的探索尝试,才有可能找出一些可解释物理世界的规律。
徐立表示,同理,在人工智能的可能性探索过程中,很多的小样本的问题不是在着手的时候就能够解决的,只有通过尝试不同的、更大的大模型泛化能力,再蒸馏到小样本、零样本的过程中才能够解决。
AI大装置的逻辑与业界火热的通用大模型相似。虽然业界对于通用大模型仍有很多争论,但其基本跑通了“更大模型实现更精准小样本应用”这条路。
2020年5月OpenAI推出有1750亿参数的GPT-3,其使用了几乎所有来自互联网的可用数据进行训练,成为迄今为止最好的自然语言处理模型。更关键的,GPT-3证明了扩展文本量(数据)、参数扩展(模型大小)以及训练计算量的增加,都将更准确地完成小样本自然语言处理任务。
仅仅一年时间,大模型的参数量已经进入到万亿时代。2021年1月,谷歌推出1.6万亿参数大模型Switch Transformer。6月,国内智源研究院发布1.75万亿参数的全球最大预训练模型悟道2.0,同时阿里巴巴也发布了万亿巨模型M6。
商汤在2017年就开始探索大参数深度网络,并对AI大装置投入研究。其AI大装置分为三层结构,九大模块。第一层是算力层,包括计算训练芯片,AI数据中心(AIDC),和底层传感器。第二层是平台层,包括数据平台、深度学习训练框架 SenseParrots、深度学习推理部署引擎 SensePPL、模型生产平台。第三层是算法层,包括创新算法模型以及算法开源计划 OpenMMLab。
AI大装置,可以看做是商汤最先进算法、算力和系统的集大成者。目前,投资56亿的商汤智算中心(AIDC)计划总算力达到3740 Petaflops(1 Petaflop等于每秒1千万亿次浮点运算),计划2021年底交付。商汤的算法工具箱里已经有17000个算法模型。除工具箱外,商汤还将一部分SOTA算法进行整合开源到OpenMMLab体系中,在GitHub上已收获37000颗星。
脚下:批量产出AI长尾应用商汤为什么推出AI大装置?
首先非常务实的一点,AI大装置直指AI大规模落地的主要障碍,靠堆人工、项目制进行的算法开发模式,效率低周期长而且成本高。AI大装置通过通用大模型,加上小样本单一场景的细分优化,将更快速批量产出海量长尾应用。
在本届WAIC的演讲中,徐立将物理世界的数字化转型划分为三个环节:场景的数据化,要素的结构化,流程的可交互化。他认为,要素结构化是AI大规模落地卡壳的地方,也是真正需要大规模AI赋能的环节。
“80%结构化应用都是低频的、长尾的场景,如果没有通用人工智能,只能采用大量人力投入到单一项目中,而且还不能很好解决这些本质上是小数据、小样本的问题。此外,技术上如果还聚焦于单一问题过程,就很难在很多通用场景下有很好的泛化能力,导致性能不稳定。”徐立表示。
相比身份识别、安防、交通、城市管理等头部AI场景,还有大量的低频但重要的长尾场景亟需智能化改造。比如,扶梯安全管理、垃圾暴露、城市火灾、高空坠物等等,其中一些甚至是小样本、零样本场景。
以比较常见的扶梯安全为例,商汤通过物体检测、行为识别、密度分析等 AI 技术,将包括跌倒、逆行、推轮椅、拉行李箱等可能导致安全问题的异常要素结构化处理,从发现异常到推送上报、再到帮助人工解决问题,全部交给AI。比如,自动识别大件行李、婴儿车等安全隐患行为,并进行语音劝阻;当有乘客摔倒时,自动降低扶梯运行速度等等。整个流程中,绝大部分工作都可以实现AI替代,只有解决问题这一步还需要人工介入。
再比如,在冬奥会场馆中,AI大装置可以快速完成场景数据化(数字孪生)、要素结构化和流程交互化(进行运动员运动轨迹分析等),还可以基于混合现实技术实现观众互动。
商汤认为,基于对泛化能力的复用,AI大装置能够降低人工智能生产要素的价格,推动物理世界的全面数字化转型。
其次,AI大装置另一个重要作用在于批量产出通用大模型。目前,通用大模型在实现了参数量级的大幅提升后,下一步就是在更多垂直场景和行业中进行验证。“每一个领域,是不是都可以有足够多的数据输入,然后用AI大装置对撞生成结果?”徐立表示。
远方:用机器猜想开启人类创新的新范式图灵奖得主,关系型数据库的鼻祖吉姆·格雷曾将人类的科学研究分为四类范式(Paradigm,某种必须遵循的规范或大家都在用的套路),依次为:实验归纳,模型推演,仿真模拟和数据密集型科学发现。
这四种范式都是基于人类已有的认知展开归纳和演绎。基于大数据的第四范式,也要先有大量的已知数据,然后通过计算得出之前未知的理论。徐立认为,人类历史上很多颠覆性的科学创新和重大突破不在这四大范式之列,更多源于“天才的猜想”,比如砸在牛顿头上的苹果,以及爱因斯坦幼年幻想乘坐的那束光。
然而面对被极大扩展的未知世界,商汤认为仅靠人脑猜想还不够,需要引入“机器猜想”。AI大装置就是商汤进行“机器猜想”的基础设施,也是进行人类创新新范式的探索。
一方面,目前一些AI算法已经不完全依赖于标注的大数据,有很多算法依赖于小数据,甚至不需要人类数据。
另一方面,当未知的空间变大,需要增加更大的算力。此前常识认为算法越精准,需要的算力就越少。事实上,过去10年最好的AI算法对于算力的需求几乎增长了100万倍。徐立认为,生命科学、材料科学、医药领域等基础学科,将最先受益于“机器猜想”,进入科学创新的新范式。
通用大模型是否是通向AGI的重要一步,业界还有很多争论。从大模型到大装置,背后的这种“机器猜想”会带来什么?过去的AI算法生产,更多是“数据越精准,模型越精准”的模式,背后是人类总想找到因果联系的思维模式。人类总是基于过去的认识,获得“确定性”的机理分解,然后建立新的模型来进行推导。
“机器猜想”可能会部分放弃对因果关系的执念,颠覆千百年来人类的思维惯例。AI大装置也将跳出精准数据输入的限制,靠更大规模的数据碰撞出更通用的大模型。
写在最后由于长周期大规模研发投入,尤其是前几年的AI过热甚至泡沫被挤破后,近两年AI企业普遍面临更加严峻的亏损问题。长期大幅亏损、商业模式和盈利预期成为AI企业上市的最大障碍。
相比之下,处在头部的商汤相对从容一些,在计算机视觉应用市场保持着营收和市场份额的领先。2021年WAIC,商汤成为了AI四小龙中唯一参会的厂商,这也侧面证明了昔日的AI四小龙正在逐渐分化。谁能抢先上市,就有机会借助二级市场的低成本融资,进一步拉开与友商的差距。
目前AI四小龙中,7月20日,云从科技刚刚在科创板IPO过会,这为普遍上市难的AI行业带来好消息。今年以来,关于商汤IPO的消息也不断传出。近日,腾讯一线消息称,商汤科技已确定A+H上市,保荐人为中金公司,最快将于8月向港交所提交上市申请。
商汤很早就明确了平台型AI公司的定位。从技术上看,AI大装置的重要性不言而喻,其“通用模型 + 碎片化场景适应能力”,是降低模型开发成本,提升长尾场景开发效率的关键。AI大装置能否在更多行业场景发挥效果,「智能进化论」会持续关注。
-END-
本文为「智能进化论」原创作品,智能进化论专注云计算和智能科技领域的深度评论。