"姚言货重"的第154篇原创文章
阅读大约需要3分钟,并帮忙点击文末的“赞”和“在看”!
ChatGPT一夜之间火遍全球,刚上线1个月,用户数已经超过1亿,而互联网当红炸子鸡TikTok用了9个月到1亿,ChatGPT这个AIaaS发展速度快的令人乍舌。作为一个AI业内人士,我是在2022年12月初注意到ChatGPT的,当时认为这是一个行业内的大进展,没想到刚过完春节没几天,ChatGPT已经成了个社会话题,二级市场上AI概念股都已经起飞,而不管ChatGPT完全和中国无关。
ChatGPT读起来有点拗口,理解起来也需要了解一点发展史。GPT的全称是“Generative Pre-Trained Tranformer”,这是由OpenAI开发的一个自然语言处理的人工智能模型,最新的GPT-3是2020年5月发布的,而ChatGPT是在GPT-3.5的基础上做了强化训练出来的。之前在这个领域最热的模型是谷歌开发的BERT,但和ChatGPT相比,效果就逊色了很多。
OpenAI最早是一家非营利(Non-profit)人工智能基金会,2019年转变为营利性组织,但是投资协议非常独特。OpenAI的创始人是著名的YC孵化器原CEO(原微软副总裁、现奇绩创坛陆奇当过中国区负责人),开发安全的通用人工智能(AGI)成立的初衷。马斯克是OpenAI的发起人之一,对,就是创办了特斯拉、SpaceX、Paypal的那个马斯克。
OpenA试图I兼顾商业利益和社会责任,微软投资130亿美元持有OpenAI约49%股份,微软有权获得75%的利润,直到收回130亿美元投资,之后分成比例逐渐下降;在利润达到920美元之后,微软分成比例达到49%;在利润达到1500亿美元之后,OpenAI投资人将无偿的把股份捐助给OpenAI基金会,完全转为非营利组织。这种组织形式非常新颖,和AB股模式完全不同,未来可能成为硅谷高爆发性业务的模板。
参与人工智能发展的组织很多,大部分是微软、谷歌、Meta、百度这些有钱的大企业,还有一些相对独立和小众的研究机构,比如OpenAI和DeepMind,他们的创始人就是为了打破大公司对技术的垄断,而且往往是这些小企业能成功推动大众对人工智能的认知以及行业的发展。我记得上一次激发人工智能巨大热潮的,就是2014年DeepMind的Alpha Go战胜了围棋选手李世石,之后开启了AI创业投资波澜壮阔的8年。
OpenAI的ChatGPT和DeepMind的Alpha Go应用场景很不一样,但都属于人工智能技术发展的前沿。人工智能技术在2012年左右第三次崛起,起因是英伟达的CUDA解决了算力问题,移动互联网的发展提供了海量数据,沉睡在柜子里快50年的人工智能算法突然就被激发出超强的能量。在各大院校坐了十几年冷板凳的教授们如李飞飞吴恩达纷纷加入谷歌百度等,追寻自身价值变现的同时极大促进了人工智能产业的发展。
人工智能最重要的发展方向是计算机视觉(CV)和自然语言处理(NLP)。众所周知,计算机视觉在人脸识别等领域准确度高于人类,进而激发出了安防这个容量巨大的新产业如商汤、海康等产业巨头,抖音/TikTok也受益匪浅。自然语言处理取得的进步更大,对客服、翻译、助理等业务影响很大,科大讯飞、天猫精灵、小度等都是自然语言处理算法创造出的巨头。但是,大众对人工智能还是很不满意,经常戏称语音助手为人工智障。
最近两年用人工智能产生内容(AIGC)异军突起,将人工智能的发展又区分为分析型和产生型,类似人脸识别、自然语言理解这些技术都被归为分析型人工智能。去年产生型人工智能突然受到关注,主要是计算机视觉相关的产生型人工智能,比如在短视频平台大火的用自己的脸转换成动画人物等,比较知名的模型是OpenAI的DALL.E,以及因为开源而被国内广大企业换马甲的Stable Diffusion,而ChatGPT就是自然语言的AIGC。
语言作为信息交流最主要的工具,一直有团队在挑战极限。最早的有IBM的Watson,前两年大放异彩的苹果Siri,后来还有创业公司如小冰等。但用户的反应一直不好,他们通常只能进行简单的查询,连2轮以上的对话都做不到,就类似在淘宝找机器人客服,永远像个智障,没有记忆,最多就是把手动输入关键字查询改成语音输入。和现在ChatGPT这样能进行多轮对话并产生高于人类基本水平的内容,简直是天壤之别。
ChatGPT并没有大众想象的那么神奇,他其实并不理解自己说的话,只是对语言字词的概率统计。因为学习的够多,所以就显得无所不能,但这种“学习”和人类的学习有天壤之别。如果观察一个婴儿的成长就会发现,人类幼崽的学习并不需要多次训练,只看一遍大人开电视,就知道去抢遥控器;只用指几次狗狗,碰到体型差异巨大的狗他也能辨认,更不需要读完图书馆所有的书才能学会对话。
人类的逻辑思维和对世界的抽象是由语言承载的,没有发明文字语言的人类永远是原始社会。人类婴儿在成长过程中,通过眼、耳、手逐渐建立对外部世界的感知,随着大脑的发育,在1岁半到2岁开始学会抽象信息,从而发展出语言系统。ChatGPT不是这样,他是用人工智能模型在进行文字频率统计,只能学习过去的语料库,比如2022年以后的信息一概不知,包括世界杯决赛成绩。
在这次ChatGPT爆火的过程中,人们能够领略世界一流公司的战略决策水平,也能够观察到科技领袖的鲜明个性。微软表现出色,不但早早对OpenAI进行了投资,而且在敏锐发现ChatGPT的潜力后,两周就宣布再投入OpenAI 100亿美元,并且在Office服务中集成ChatGPT,Bing搜索引擎更是迅速将ChatGPT结合并且上线。这对谷歌造成了巨大压力,古典型关键字搜索真的应该被淘汰了。
微软并不是心血来潮,行动如此迅速,源于微软几乎错过了整个互联网时代。为了打破谷歌占据消费互联网搜索引擎入口的优势,微软的Bing必应搜索一直在尝试反击,秘诀就是用人工智能技术优化搜索结果(很少有人点开搜索结果第二页,用AI算法把可能最优的结果往前提,可以抵消谷歌大规模爬虫系统的优势),这也是为什么微软亚洲研究院贡献了5000名以上的AI人才,被称为中国人工智能的黄埔军校。现在的微软只是回来了,试图用OpenAI的ChatGPT,将谷歌通过投资DeepMind、Boston Dynamics、Waymo积累的光环击碎。
ChatGPT这次突然引爆舆论,在业内人士看来颇有些不可思议,连OpenAI自己也没想到,自己只开发了13天,就影响了全世界。1个月收获1亿用户,取得微软100亿美元投资,逼得谷歌连投竞争对手,并把业务组织完全变阵。微软宣布Office全面集成ChatGPT,要打破谷歌对搜索引擎20年的垄断,就是《三体》里的“毁灭你,与你无关”。国内各种公司无耻的蹭热点,比如百度说自己3月要推出自己的ChatGPT模型。拜托,OpenAI没有开源,您是打算拿开源的GPT-3硬改吗?
大家都很好奇ChatGPT是否能改变世界,如何改变世界?答案是“能”,并且改变的过程有点残酷。经过几天的试用,已经有很多人发现ChatGPT写论文、考试、做表格(信息整理)、编程序、写诗歌等能力超越80%的普通人,甚至能通过大学入学考试、谷歌程序员招聘等。这将大大影响教育行业,因为语言是逻辑思维的载体,如果因为用了ChatGPT连文字都不学,其他一切都将变成空中楼阁(已经有很多大学封了ChatGPT)。
从产品和投资的角度看,现在客服、翻译、文员、初级程序员、文案、家教等纯粹文字工作者将受到第一波冲击,规模将达到上千万人,比如印度是美国服务业的第一大服务提供国,将受到巨大的影响。随着失业人口增加、行业巨变,紧接着大量的语言处理相关的公司比如科大讯飞将失去价值,之前火过一阵子的语音助手比如天猫精灵、小度等都将乏人问津。
中国将成为被ChatGPT冲击的绿洲,由于众所周知的原因,ChatGPT没有任何可能在国内落地。由于GPT等模型都还是黑箱,如果不能控制计算机能说什么不能说什么,国内这些个李鬼可能连出道的机会都没有。中国公司生存的逻辑和西方不同,比如现在百度就非常期待ZF迅速封了ChatGPT,自己弄个什么假李鬼能蹭上热点;实在不行就退守到信创业务,反正地方政府总得养活他们。政府要问为什么质量不如ChatGPT,那就是没钱、没人、没算力(美国制裁),反正就是跟自己没关系。
往好处想,当年蒸汽机刚发明的时候,对社会造成了大规模破坏,但后来就进入了工业化时代,狄更斯当年就说“这是最好的时代,也是最坏的时代”。生产力得到了巨大提升,造成了大量失业人口,但后来又创造出更多的工作岗位,只是当年被蒸汽机冲击的人就永远的成为了代价。在ChatGPT刚刚出现的现在,每个人都要仔细思考自己是否就是那个代价,并且怎样才能赶上正在呼啸而来的未来号快车。