机器人跳舞、分辨瓜果,生成式AI浪潮下被混淆的概念

通信什么咬一口 2024-07-18 07:46:39

(源初/文)“如何卖掉一支笔?”“我的这支笔有AI。”这是最近的一个网络改编段子,但又反衬出了AI浪潮下的一大现象,似乎所有的事物都要和AI挂上钩,而大量的AI又要从生成式AI的热潮开始说起。但值得关注的是,很多看似智能的表象背后,却与AI关系不大,而很多AI项目的演示背后,却同样又与生成式AI关系不大。

到处跑穴的机器人

很多人都会在各大展会上看到跳舞、泡咖啡,或是当牛做狗的机器人,似乎象征着开启了人工智能时代的序幕。然而,细心的人早已发现,很多机器人早在AI概念兴起前就已经出现,只是近两年来才被冠以了AI的象征符号。

但是,从原理上看,多数机器人只是在简单地执行固定的动作,或是被人进行远程遥控,距离自主性的“智能”二字相距甚远。机器人作为物理设备,可以用来执行任务,但不一定包含AI。AI可以嵌入到机器人中,使其具有智能行为,但二者并不完全等同。

作者在此不妨对几种常见的机器人进行盘点。例如使用机械臂按照规定动作进行咖啡冲泡的机器人,尽管它被录入了所谓顶级咖啡大师的制作手法,但自身并不具备灵活冲泡咖啡的能力,甚至无法对豆子进行辨识,以便采取不同的冲泡手段;又比如机械狗,这种机器人可谓在展会中随处可见,但该产品很多时候都需要人工进行遥控;又或是集体跳舞或组队行动的机器人,不妨反过来理解,参与集体舞蹈,实现规范动作的人本身就在执行机械性的指令,又缘何要反过来说会跳集体舞的机器人就变得智能了呢?

AI与生成式AI

另一个更不容易被分辨的语言游戏便是,借着讲分辨式AI,或其他AI的产品,来蹭生成式AI的热度。例如很多年前的通过摄像头来智能判断出物体类型的AI,就与生成式AI并不相同。生成式AI作为AI的一个子领域,专注于生成新的内容。GenAI通过学习大量的示例数据来创建新的文本、图像、音乐、代码等。常见的应用包括生成文本(如GPT模型)、图像(如DALL-E)、音乐和视频。

而摄像头进行智能判断类型的AI一般为分辨式AI,相比生成式AI有着显著差异。分辨式AI和生成式AI有显著差异。分辨式AI使用带标签的数据训练分类器,通过映射函数预测未标注数据的标签,典型算法包括支持向量机、决策树和逻辑回归等,依赖大量高质量标注数据,尽管提高了训练成本,但也限制了复杂模型的发展。生成式AI则利用大量未标注的数据X,自我生成数据和隐藏信息,摆脱了对标注数据的依赖。在强大GPU算力和海量数据支持下,生成式AI能实现大型复杂模型的训练,结合标注数据和强化学习机制,可以更快收敛到正确方向,生成自然语言、音乐、图像等内容,推动通用人工智能的发展。总之,分辨式AI侧重分类和预测,生成式AI侧重内容生成。

另外,一些企业还会利用可能基于模板生成的内容来误称为“生成式AI”,实际上生成式AI使用复杂的算法和模型来生成新的内容,而模板生成仅仅是基于预定义的模板进行填充;同理,企业有时会把任何形式的自动化技术都称为“AI”。但自动化可以通过预设的规则或简单的算法实现,而AI通常涉及更复杂的机器学习和数据驱动的决策过程;在大数据领域,有的企业会将如统计分析、数据挖掘这类数据分析技术标榜为AI能力,但数据分析侧重于理解数据中的模式和趋势,而AI则更注重模拟人类智能来做出决策或生成内容。

多年技术积累

不过这里需要肯定一点的是,很多公司会以过往的AI应用案例,来证明如今他们的生成式AI项目有着多年的技术积累,这一说法确实没有骗人。

分辨式AI的技术积累对生成式AI的研发有很大帮助,具体表现如下。首先,分辨式AI使用的许多模型和算法,如卷积神经网络、循环神经网络、Transformer等,也广泛应用于生成式AI。这些架构和训练技巧可以直接用于生成式模型的设计和优化。例如,Transformer架构在自然语言处理中已经证明了其强大的性能,它同样被应用于生成式模型中,如GPT系列模型。通过共享这些技术,生成式AI能够快速吸收分辨式AI的研究成果,提升模型的性能和稳定性。

其次,分辨式AI在数据处理和特征提取方面的技术积累为生成式AI提供了重要基础。生成式AI需要理解和学习数据的底层结构,这离不开分辨式AI在特征提取和数据预处理方面的支持。例如,生成对抗网络中的判别器用于评估生成器的输出质量,这种相互作用推动了生成式模型的改进。此外,分辨式AI技术可以用于生成合成数据,增强训练集的多样性和规模,从而帮助生成式AI更好地学习和生成高质量的内容。这种数据增强技术在图像、语音和文本生成等领域都有广泛应用。

最后,生成式和分辨式模型可以结合使用,形成混合模型,在多个应用中发挥优势。例如,在图像超分辨率任务中,生成式模型可以生成高分辨率图像,而分辨式模型可以用于评估和改进生成结果的质量。在文本生成与分类任务中,生成式模型可以生成自然语言文本,分辨式模型可以对生成的文本进行分类和评估。这种混合模型能够充分利用两者的优势,提升整体性能和效果,从而在更多实际应用中提供更强大的解决方案。通过这种相互补充的方式,AI技术能够在更多领域内取得突破性进展。

当很多企业纷纷挂上AI的标签,对于旁观者而言,需要冷静思考其中的技术底色,理解和区分这些技术概念,有助于更清晰地认识AI的潜力和发展方向。

1 阅读:1

通信什么咬一口

简介:感谢大家的关注