德意志银行最新报告:全球AI行业杀得昏天黑地

短平快说读 2024-07-12 14:39:33

AI是第四次工业革命得核心,正当国内AI行业踌躇不前之际,国际上的AI行业竞争只能用“惨烈”来形容。现在几乎所有国家都意识到了AI的重要性。下一个时代的核心技术一定是AI。

为此,在国际市场上,AI行业的技术迭代非常快,各方都想成为第一个吃螃蟹的人。昨日,德意志银行就眼下国际市场中的AI行业竞争形势发布了一份最新研报。

德意志银行表示,目前,OpenAI的专有模型让竞争对手望尘莫及。一项调查发现,超过四分之三的工程师和产品制造商(主要是科技、咨询和金融公司)更喜欢使用其GPT大型语言模型。仅OpenAI最先进的GPT-4模型就占使用率的45%。

现在,即插即用似乎比适应性更重要。很少有受访者使用Meta和Mistral等开源模型,因为开源开发人员也因不完全“开放”而面临压力,正如德意志银行在时事通讯中讨论的那样。

在本期“人工智能最新动态”中,德意志银行分析了大型科技公司如何进一步对小型人工智能公司施加影响,例如亚马逊“收购”Adept,以及苹果向OpenAI董事会派出观察员。然后,德意志银行讨论了法国研究实验室 Kyutai 发布的会说话的人工智能 Moshi,以及文本转音频人工智能初创公司 ElevenLabs 如何重现从伯特·雷诺兹到劳伦斯·奥利维尔等名人的声音。

有人批评一些开源开发者将他们的代码保密

成立七个月的Sentient Labs已筹集8500万美元,用于开发一个平台,该平台将使工程师和研究人员能够为开放代码AI做出贡献并获得报酬。

据Founders Fund合伙人、种子基金共同负责人Joey Krug称,通过提供一种将开源模型货币化的方法,AI实验室旨在消除“阻碍开源AI发展的问题”。

虽然基于区块链的平台的运营细节仍在最后确定中,但有传言称将奖励那些完成AI训练所必需的数据标记等任务的人。

“开源”是人工智能模型的荣誉徽章,表明它是免费提供的、工作原理透明的,并且可以根据用户的确切需求进行定制。与GPT-4等黑盒专有模型相比,它也将得到监管机构更宽松的对待。然而,在现实中,是什么让开源模型真正“开放”正日益受到激烈的争论和“开源清洗”的指责。

开发人员,即使是开源模型的开发人员,也倾向于将大型语言模型(LLM)背后的代码保密。例如,Meta只透露了运行Llama的脚本。出于这个和其他原因,Meta的首席人工智能科学家Yann LeCun最近在社交媒体上因说Llama是开源而受到批评。

人工智能公司担心,公开代码可能会使他们的模型更难货币化。例如,人工智能挑战者Mistral尚未发布其开源模型的代码,但最近内置了附加组件,公司可以购买这些附加组件来根据自己的需求定制模型。

除非有明确的定义,否则一些人工智能公司可能会寻求获得声称“开放”的法律利益,但实际上并非如此。欧盟即将出台的《人工智能法案》是世界上第一个全面的监管框架,它对高风险人工智能模型的开发者制定了严格的透明度规则,但对开源模型的开发者则给予了更大的信任,因为这些模型应该已经是透明的。

关于什么可以被视为开源的分类是关键。开放源代码倡议为开源模型制定标准并向实施者颁发许可证,该倡议正在更新其定义以将生成式人工智能考虑在内。欧盟新成立的人工智能办公室是根据《人工智能法案》成立的,也在制定自己的定义。

Meta没有获得开放源代码倡议的许可。事实上,该倡议的执行董事Stefano Maffulli告诉 TechCrunch,Llama 模型“不能被视为开源”,Meta的一些人“知道这有点牵强”。

其他人已经尝试定义什么使开源模型“开放”。一项研究确定了14个可以评判 LLM 的标准,包括提供用于培训、微调和运行LLM的源代码以及其培训材料。托管开源模型的Hugging Face平台已收紧其基准Open LLM Leaderboard的标准。

大型科技公司对小型科技公司的影响力不断增强

亚马逊已经从人工智能初创公司Adept挖走了多位高层人物,包括联合创始人兼首席执行官David Luan。作为交易的一部分,亚马逊将获得Adept的技术许可,该技术为软件任务的半自主人工智能代理提供动力。

对Adept关键人才的“精心策划的收购”类似于微软以6.5亿美元“收购”Inflection AI 的 Mustafa Suleyman及其大部分团队。

与此同时,据彭博社报道,苹果将与微软一起在OpenAI设立董事会观察员。此前,苹果表示将免费将GPT-4o集成到将于秋季推出的新iOS 18中。与董事会成员不同,董事会观察员对OpenAI的运营方式没有发言权,但会向苹果提供OpenAI的内部信息。

与其他大型科技公司一样,亚马逊也在内部开发人工智能功能,以减少对第三方初创公司的依赖,例如Claude的制造商Anthropic,该公司于3月份向其投资了40亿美元。微软已开始开发代号为Metis的人工智能聊天机器人;发布了面向使用AWS的企业的Amazon Q;并计划在未来十年内向数据中心投资1000亿美元。

小型科技公司必须接受大型科技公司大量资金支持带来的自主权丧失,无论是通过合作伙伴关系(如微软/OpenAI)还是通过精心策划收购顶尖人才和技术(如微软/Inflection AI)。Adept表示,与亚马逊的交易有助于它避免“在融资上投入大量精力”。

监管机构热衷于避免早期数字技术浪潮中自我强化的市场集中。欧盟委员会表示,希望确保收购兼并交易不会“逃避德意志银行的合并控制规则”。欧盟委员会决定不对微软4月份报道的130亿美元投资OpenAI进行正式的竞争调查,目前正在调查该合作伙伴关系的排他性条款。(相比之下,亚马逊与Adept的许可协议是非排他性的)

与此同时,联邦贸易委员会正在调查微软收购Inflection AI顶尖人才的情况,以及对科技公司涉嫌反垄断行为的其他调查。

拥有强大人工智能人才的小型科技公司并不缺乏,它们需要大型科技公司可以提供的计算和客户。这些公司包括Cohere、AI21和Stability AI,Stability AI是文本转图像生成器Stable Diffusion的制造商,该公司最近任命了一位新首席执行官。

随着投资者在资助人工智能初创公司时变得更加挑剔,可能会出现一场争夺合作的竞争。第一季度,美国生成式人工智能初创公司风险投资的早期阶段的资金下降至约1.23亿美元,比上一季度下降了三分之二以上,而交易数量减少了一半以上,至34笔。

挑战者源源不绝

ElevenLabs是一家利用人工智能生成的声音将文本转换为音频的公司,它重现了著名演员的声音,并将其添加到新推出的阅读器应用中。文章和电子书可以通过“情感丰富、情境感知的画外音”收听。

与此同时,由亿万富翁泽维尔·尼尔和前谷歌董事长埃里克·施密特支持的法国人工智能研究实验室Kyutai推出了一款名为Moshi的会说话的聊天机器人。在上周于巴黎举行的发布会上,它说话流畅,模仿人类的情感,并用法国口音朗诵自己创作的诗歌。您现在可以注册等候名单。

在OpenAI ChatGPT的“语音模式”延迟推出之前,人工智能公司正在竞相发布会说话的人工智能,可能在本月晚些时候推出。

由于之前出现故障,语音模式可能只对一小部分付费用户开放,而且没有斯嘉丽约翰逊批评的“Sky”声音,后者的声音与她自己的声音非常相似。会说话的人工智能发布令人印象深刻。例如,Moshi在问题和答案之间只需要200毫秒。

逼真的人工智能声音的数量已经在增长,尤其是在TikTok等社交媒体平台上,一名用户未经摩根弗里曼同意就模仿了他的声音。

人工智能公司之间的竞争已经超出了发布时间的范畴,与人工智能中的许多其他问题一样,它也影响着开源和专有选项之间的竞争。本着开源精神,Kyutai表示计划发布支持Moshi的基础模型的代码和权重,该模型足够小,可以在设备上本地运行。

未经他人同意生成人工智能声音引发了法律和道德问题——约翰逊在说听到 ChatGPT 的声音与科幻聊天机器人电影《她》中她自己的声音相呼应后感到“震惊”和“愤怒”,之后她聘请了律师。这可能只是冰山一角,因为可访问的文本转语音模型可能很快就会产生大量的人工智能声音。

很难阻止消费者未经授权使用真人的声音,但使用人工智能声音的人工智能开发者或公司最终可能会成为众矢之的。一种方法是与名人的遗产达成交易,以获得AI声音,就像ElevenLabs所做的那样。另一种方法是聘请演员为广告创建栩栩如生的AI头像,就像TikTok所做的那样。与此同时,YouTube上周更新了其隐私指南,允许用户要求删除AI生成的声音和面孔,但需经过审查。

0 阅读:12

短平快说读

简介:感谢大家的关注