今天我们来聊聊那些所谓的“大模型公司”。你听他们讲“技术创新”、“改变未来”,感觉真是未来科技的领军人物。但你要仔细一想,会发现这些公司的技术含量远没有你想的那么高。他们玩的很多就是“拿来主义”——拿现成的开源技术,稍微改动一下,套个壳包装,就对外宣称是自己的创新。
先说说大模型的训练过程。以前,训练一个大模型,尤其是那种几十亿、上百亿参数的模型,那可是要烧不少钱的。显卡厂商那会儿日子过得跟皇帝似的,AI公司买显卡跟买白菜一样,“一箱一箱”地往家拉。那阵子显卡市场就像“春江水暖鸭先知”,供不应求,显卡价格蹭蹭往上涨。显卡厂商都乐得不行,一边卖显卡一边心里盘算着又能赚多少钱。
可这两年,这股热潮突然冷了。为啥呢?因为大模型公司发现,根本不需要自己从零开始训练模型。有现成的开源模型可以用啊!就拿Meta发布的LLaMA模型来说,这个模型一发布,很多公司立马拿过来用了。稍微调调参数,加点自己业务需要的数据,模型就变成他们的了。这就省去了从头训练模型的大量计算资源和时间成本。VentureBeat有一篇报道就提到,现在越来越多的公司不再自己训练模型,而是选择微调现成的开源模型。显卡需求骤减,市场一下子就凉了。显卡厂商的好日子也跟着“过去了”,正应了那句古话:“花开堪折直须折,莫待无花空折枝”。
这让我想起另一句古诗:“旧时王谢堂前燕,飞入寻常百姓家”。这些开源模型原本是大公司比如Meta和微软开发出来的,但现在,各种中小公司拿过来改一改,摇身一变,成了他们自家打的“技术突破”牌子。你看,外面看起来是“华丽”的创新,实际上不过是换了个标签而已。
再看看微软,他们也不落后。微软通过Azure平台,给企业提供现成的大模型,比如GPT-4。企业只需要根据自己的需求做点微调,就能直接应用在自己的业务里。这就像你去超市买个半成品饭,只需要回家稍微热一下,就能端上桌了。微软曾公开表示,像Lionbridge这样的客户,通过微调GPT-4模型,不仅提高了翻译的准确度,还省了不少钱。微软帮他们解决了大问题,而公司自己却不用从头开发什么新技术,真是一举多得。
你以为这些公司天天都在研发尖端科技?其实,更多的时候,他们是在微调别人辛苦搞出来的模型,然后告诉你“我们突破了技术的极限”。就像古人说的,“偷得浮生半日闲”,这些公司偷得是模型,省下了大量开发成本和时间,轻轻松松拿去赚钱。
显卡厂商的苦日子也随之而来。以前AI公司动辄买几百上千张显卡,现在大家都用开源模型,显卡需求骤降。这行情啊,就像古话说的“屋漏偏逢连夜雨”,显卡厂商真是日子不好过。市场冷了,显卡价格也降了,曾经的“风光”现在成了“落寞”。
5G远程手术的闹剧和这些AI公司的操作如出一辙[ ]。5G技术的确有前景,但有些公司硬是把它吹得离谱。你想想,一个能用网线搞定的手术,非得在手术室里装个5G基站,最后还得依赖光纤传输。这就好比“脱裤子放屁”——看似高大上,实际是多此一举。为什么这些公司这么干?因为他们懂得“科技营销”,通过大肆宣传“未来感”,吸引眼球,忽悠政府的补贴。
你不觉得这种现象和AI公司很像吗?他们包装自己的技术,拿AI的“热词”搞噱头,结果一查,核心算法全是从开源社区搬来的,模型也是别人的,只是换了个名字。他们这么做的目的就是套补贴!就像有些公司打着“智能交通”或者“智慧城市”的幌子,搞得一副高科技的样子,实际上用的全是现成的模型,稍微调了调数据,就成了自己的“创新”。搞不好还能申请几轮政府的专项补贴。
这不禁让我想到一句话:“脱离实际的创新,无异于拿着皇帝的新衣去炫耀。”5G远程手术的事儿让我们见识了科技如何被滥用来炒作,而AI公司这种忽悠政府的钱的手段,其实本质上差不多。
古人说:“醉翁之意不在酒,在乎山水之间也。”这些AI公司的醉翁之意显然不在技术,而在于那笔丰厚的补贴。他们不是为了推动科技进步,而是为了套政府的钱。你说,这是不是另一场科技版的“皇帝的新衣”?
总的来说,我们看到的很多“AI突破”,背后可能并不如宣传的那么光鲜亮丽。更多的时候,这些公司是在用“高科技”的外壳,包裹着“忽悠”的内核,精心策划着一场场“表演”。科技的本质是推动社会进步,但某些公司却把它变成了套补贴的工具,忽悠的对象从用户变成了政府。这就让人不得不反思,当我们听到这些科技公司的宣传时,该不该问一句:这是真技术,还是又一次“5G远程手术”的翻版?