"姚遥领先"公众号的第163篇原创文章
阅读大约需要3分钟,并帮忙点击文末的“赞”和“在看”!
爆炸新闻:OpenAI竟然开除了CEO奥特曼(Sam Altman)!
美国时间周五OpenAI发表声明,CEO奥特曼下台,CTO临时接任CEO,公司将向全球征集新CEO。原因说的很简单但非常直接,是因为奥特曼“不能始终坦诚的与董事会沟通”。要知道,上周OpenAI刚发布了GPT4 Turbo,号称时间最短但最炸裂的发布会,为AI开启了无限想象。董事会这么搞必然众说纷纭,有人说是因为奥特曼想继续大规模投入的开发GPT5追求通用人工智能AGI,但却没有让现在已经遥遥领先的GPT4充分商业化;也有人说是因为OpenAI已经发现了致命的安全问题。不管怎样,赚钱才能可持续发展,股东不满很正常,谁也不想把几十亿美金扔进无底洞。
连奥特曼这种绝顶聪明的CEO都被开除,我们中国的AI从业者却只能望洋兴叹。由于美国对AI芯片的全面禁售,导致中国AIGC领域气氛压抑,昨天阿里刚刚声明因为美国禁售AI芯片而停止拆分智能云业务。当然,咱们自己人也不省心,刚做出点东西的大模型创业公司拼命吸金,如智谱华章三个月估值就从50亿涨到了200亿,简直骇人听闻。这周又突然爆出,创业导师李开复老师的零一万物公司刚发布的号称业界最好的大模型涉嫌直接复制Meta开源的LLaMA。
AIGC新闻有点多,但我发现基本上没有特别通俗的把这波AIGC说清楚的文章,那我就来写一篇,里面肯定有所疏漏,还望海涵。
人工智能这次崛起大概始于2012年,主要是因为英伟达的CUDA系统解决了人工智能算法加速的问题,之后英伟达一路开挂,推动并乘上了AI第三次热潮,把老对手英特尔踩在脚下,股价遥遥领先涨到了1万亿美元。刚开始的“欲望膨胀期”大家对AI期望值很高,以为会彻底改变世界,经过一段时间后发现,主要是RNN、CNN算法受益最大。从商业场景上看,AI在图像分析上的应用突飞猛进,直观感受就是人脸识别迅速普及。
市场对AI的期待很高,但真正因为AI而发展起来的企业主要做CV(计算机图像)的公司,比如名噪一时的AI四小龙比如商汤、旷视等。也有人说,字节跳动是AI驱动的最著名公司,当然,内容分发算法肯定是AI的应用,但字节跳动的成功并不只是因为AI,AI已经渗透进了数字化内容的方方面面,比如SHEIN就从头到尾都应用了AI,但我们很难说SHEIN是因为AI而成功的,因为高效的供应链体系才是真正的关键。
十年过后,大家以为AI已经发展的差不多了,大量科学家也从创业公司或大企业回到高校继续搞技术,但是没想到,2022年底ChatGPT横空出世,大模型、AIGC突然爆发,把这一波人工智能热潮又推进了一大步。很多创业导师又开始了伟大的预言,如猎豹傅盛,号称AIGC将真正改变世界,潜力无穷无尽,甚至通用人工智能AGI也已近在咫尺。虽然他们说的有几分道理,但大模型在2018年就已经发源了,请问前几年他们为什么失语,甚至春节前他们都还不知道大模型是什么。
再来说说大模型,其实主要的推手是Transformer架构的突破。Transformer架构是谷歌于2018年提出,之后不少公司都基于Transformer开始构建自己的大模型,谷歌自己的Bert在语言处理上表现优异,虽然抢了市场先机,但效果比后来者OpenAI的ChatGPT逊了不止一筹。互联网行业就是赢家通吃,ChatGPT惊艳登场,几乎所有的眼球、用户都被吸引过去,虽然谷歌后续投资了OpenAI的竞争对手Anthropic推出聊天机器人Claude,但再也激不起水花了。
OpenAI上周的发布会表明,GPT的发展正在乘着火箭往上窜,短时间内没有任何企业能撼动他的位置,对,我说的是谷歌及其投资企业,尽管Transformer架构是谷歌提出的。微软本周也举行了发布会,把GPT集成进了几乎所有产品,明显是为了搭OpenAI的便车。通过Copilot,用户可无缝使用GPT4,除了Office365其他都免费。而我们中国企业,由于AI大算力芯片被美国禁售,再加上原创技术不给力,只能眼睁睁的看着美国在遥遥领先。
大模型领域其他公司就完全没有机会了吗?当然不是。别忘了,之前人工智能的高速发展是计算机视觉推动的,Transformer在语言、文字领域已经得到了充分的证明,但在视觉领域的潜力还没有得到释放。已经有很多人注意到了这一点,但行稳致远的其实是著名的汽车公司特斯拉。大家回想一下,过去几年里,马斯克一直说视觉就可以解决自动驾驶问题,对激光雷达等辅助设备不屑一顾,其实底气就来自于Transformer带来的巨大潜力。
OpenAI就是在马斯克的支持下于2016年成立的,他当时就为OpenAI争取来了巨大的资源,比如黄仁勋就看马斯克的面子给OpenAI捐赠了首台超级计算机DGX-1。OpenAI当然投桃报李,ChatGPT用了2万块H100 GPU训练。尽管有自研AI芯片的想法,但OpenAI还是让英伟达显卡成了AIGC硬通货,迫使后续的竞争对手融资的第一件事就是囤英伟达的显卡。马斯克也没闲着,他在OpenAI身上看到了Transformer的巨大潜力,就把Transformer应用到了自动驾驶领域。
BEV+Transformer是特斯拉独特的技术路线,甚至可以说在自动驾驶领域是独一份。特斯拉的竞争对手主要基于CNN算法,想利用激光雷达+高精地图来弯道超车,但是发展到现在才发现,这样的方案不但成本高,还有些致命缺陷无法克服。特斯拉的FSD即将商用,再加上GPT的巨大成功,主流厂商正从激光雷达方案转回到BEV+Transformer。但是这种方案需要海量数据和超高算力,尤其是自动驾驶芯片需要针对Transformer重构,特斯拉准备好了,其他人呢?
Transformer出现之后,在视觉领域有很多的探索,比如Vison Transformer、DETR、Image GPT、Swin Transformer等,尽管还未到商业化程度,但在图像分割、图像分类等领域都取得了巨大的进步,也让产业界对Transformer的潜力有了更高的期待。Transformer对语言和视觉的处理逐渐统一,这也是为什么出现了很多如Stable Diffusion等多模态的大模型,能够用语言生成图像。
Transformer的自注意力机制能够让机器更好的理解上下文,那么机器人就成了Transformer理所当然发展的领域。机器人需要语言和视觉,又需要个性化,Robotics Transformer应运而生。马斯克早就看到了这一点,在2022年就发布了Optimus人形机器人,当时有观点认为特斯拉要在机器人上复用自动驾驶能力,现在看Transformer即将在机器人领域大展拳脚才是主。对了,Transformer就是“变形金刚”,Optimus是“擎天柱”,都是机器人,
这项技术最可怕的地方在于,如果统治者一直用自己的思维来训练AI,让AI近乎完美的复制自己,临终前把自己的思维复制进AI,再给AI一副机器人的身躯,间接能够实现永生,最后到底是人在统治人类,还是机器人在统治人类?