OpenAI o1 来袭:开启推理新时代,是迈向 AGI 还是被过度期待?
在科技的海洋中,总是时不时地涌起惊涛骇浪,而这一次,OpenAI 宛如一位冲浪高手,带着他们全新的杰作 ——OpenAI o1 人工智能模型,站在了浪尖之上。这个新模型就像是一颗划破夜空的流星,瞬间吸引了全球的目光。
OpenAI o1 可是带着满满的创新气息而来。它有 o1 - preview 和 o1 - mini 两个版本呢,不过目前仅仅支持文本哦。而且它已经向所有 ChatGPT 的 Plus 和 Team 用户推出了,在 API 中也向 Tier 5 开发者推出了。这就像是一场盛大的科技派对,邀请了各路高手来体验这个新玩意儿。
这个新模型可不是徒有其表,在能力方面那可是相当厉害。根据 OpenAI 官网的评测,它在数学和代码问题的处理上简直如鱼得水。更让人惊叹的是,在物理、生物和化学问题基准测试中,它的准确度竟然超过了人类博士水平。这就好像是一个超级学霸,在各个学科领域都能轻松拿下高分。
这样的出色表现,自然吸引了全球的 AI 名人的好奇心。从 OpenAI 的多位高管,到英伟达的高级科学家,再到纽约大学的教授等各路大咖,都纷纷跑来一探究竟。大家的看法那可是五花八门,不过总体上可以分为两个阵营。
一个阵营以 OpenAI 的高管和研究员为代表,他们对这个新模型那是赞不绝口,仿佛发现了新大陆。OpenAI 首席执行官山姆・奥特曼就说了,OpenAI o1 是他们迄今为止最强大的人工智能模型。虽然它也不是十全十美,还有一些缺陷和局限性,但这初次体验就已经让人震撼了。他还说这预示着一个新范式的诞生,人工智能已经迈进了能够进行广泛而复杂推理的新时代。这就像是在说,我们已经站在了一扇通往新世界的大门前,而 OpenAI o1 就是那把打开大门的钥匙。
OpenAI 总裁格雷格・布罗克曼也不甘示弱,他说 OpenAI o1 是他们首个通过强化学习进行训练的模型。这个模型在回答问题之前会深思熟虑,这可是一个充满巨大机遇的新模型。无论是在数量上,推理度量有了显著提升,还是在质量上,通过简单英语就能 “阅读模型的思维”,这种忠实的思维链让模型变得更可解释。不过他也提到,这项技术还处于早期阶段,带来了新的安全机会,他们正在积极探索,像是可靠性、幻觉问题以及对抗性攻击的鲁棒性这些方面。
思维链作者、OpenAI 研究员 Jason Wei 也对这个模型赞赏有加。他说 OpenAI o1 是一个在给出最终答案之前会进行思考的模型,它不是仅仅通过提示来训练思维链,而是通过强化学习让模型更好地完成思考过程。在深度学习的历史上,我们一直在扩展训练计算,但思维链是一种自适应计算方式,也能在推理时进行扩展。虽然这个模型在某些测试中显得很强大,但不一定能直接转化为用户可以感受到的效果。即使是对科学工作者来说,找出 GPT - 4 不如 OpenAI o1 的提示也不容易,但一旦找到了,就会觉得非常惊奇。这就像是在探索一个神秘的宝藏,虽然过程有点曲折,但一旦发现了宝藏,那种惊喜是无法言喻的。
OpenAI 研究员马克斯・施瓦泽则认为,不需要一个 GPT - 6 级的基础模型来实现人类水平的推理能力,强化学习才是通往 AGI 的关键,而 OpenAI o1 就是这个观点的证明。
作为 OpenAI 创始成员之一的安德烈・卡帕西,他的评论有点特别。他吐槽了模型的 “懒惰” 问题,说 OpenAI o1 - mini 一直拒绝为他解决黎曼假设,看来这个模型也不是那么完美无缺嘛。
英伟达高级研究科学家 Jim Fan 和卡内基梅隆大学计算机科学博士生詹姆斯・坎贝尔虽然不是 OpenAI 工作人员,但也给了好评。Jim Fan 说这可能是自 2012 年原始 Chinchilla 缩放定律以来,大语言模型研究中最重要的进展。关键在于两个曲线的协同作用,而不是单一曲线。人们之前通过延伸训练缩放定律来预测大语言模型能力将陷入停滞,却没预见到推理缩放才是真正打破收益递减的关键。这就像是在黑暗中摸索了很久,突然找到了一盏明灯,照亮了前进的道路。
博士生詹姆斯・坎贝尔展示了 OpenAI o1 预览版在美国数学邀请赛上的表现,和 GPT - 4o 相比,它的解答率要高得多。这就像是一场比赛,OpenAI o1 预览版一马当先,把 GPT - 4o 远远地甩在了后面。
不过,也有一些人对这个新模型持保留态度,形成了另一个阵营。HuggingFace 首席执行官兼联合创始人克莱门特・德兰吉就说,人工智能系统并不是在 “思考”,而是在 “处理” 和 “运行预测”,这种技术往往给人一种错误的印象,让人们觉得这些系统像人类一样智能,但这只是一种宣传策略。这就像是揭开了一层神秘的面纱,让我们看到了这个模型的本质。
纽约大学教授、美国知名 AI 学者加里・马库斯也发表了自己的看法。他说 OpenAI 的新模型确实令人印象深刻,但它不是 AGI,而且离这个目标还很远。他还指出了这个模型的一些问题,比如关于它如何工作的细节不多,已测试的内容没有全面披露,与 GPT - 4 的其余部分并未完全整合等等。这就像是在欣赏一件艺术品的时候,发现了一些瑕疵,虽然整体还是很出色,但这些瑕疵也不容忽视。
沃顿商学院管理学教授伊森・莫里克说他已经用了 1 个月的 OpenAI o1,这个模型在很多方面都很惊人,但也有一些限制。他还通过填字游戏这个例子,展示了这个模型的收益和局限性。这个模型在解决需要规划的任务时表现得非常好,但仍然不是完美的,存在错误和幻觉。这就像是在使用一个工具,虽然它很强大,但我们还是要小心使用,避免出现问题。
对话式搜索引擎 Perplexity CEO 阿拉温德・斯里尼瓦斯试图 “猜测” OpenAI o1 模型的原理。他不认为这个模型所给出的答案是经由反复批判性反馈精心提炼的结果,而且认为单纯依赖大型语言模型来得出答案并不足够可靠。他建议将代码执行融入其中,并结合从知识图谱中直接提取的事实,这样可能会更有效。
从这些不同的观点中,我们可以看到,OpenAI o1 的 “思考” 时间更长了,也更擅长处理标准化程度更高的 “理科” 问题了,这对科学领域的发展来说确实是一件好事。就像是在科学的花园里,又多了一把锋利的剪刀,可以把那些杂乱的枝叶修剪得整整齐齐。但是,除了那些是非分明的逻辑推理问题,世界上还有很多没有标准答案的问题。对于这些问题,大模型如果能为人类解决,那或许才能真正接近 AGI。这就像是在攀登一座高峰,虽然我们已经爬了很高,但距离山顶还有很长的路要走。
OpenAI o1 的出现,无疑是在人工智能领域投下了一颗重磅炸弹。它引发了人们对人工智能未来发展的热烈讨论,也让我们看到了人工智能的潜力和挑战。无论是对它赞不绝口的阵营,还是持保留态度的阵营,他们的观点都为我们提供了不同的视角,让我们更加全面地认识这个新模型。在这个快速发展的时代,我们期待着人工智能能够不断进步,为我们的生活带来更多的便利和创新。但同时,我们也要保持清醒的头脑,认识到人工智能还有很长的路要走,还有很多问题需要解决。就像是在一场漫长的旅程中,我们既要欣赏沿途的美景,也要时刻注意脚下的路,确保我们能够安全、顺利地到达目的地。