OpenAI 7 月 30 日表示,它已经开始向少数付费 ChatGPT 用户推出高级语音模式,让他们能够测试更自然、实时的对话。
高级语音模式允许 ChatGPT 提供可以被打断的实时响应,此外它还能够感知和回应幽默、讽刺等。新模型不需要像当前的 ChatGPT 语音那样将您的语音转换为文本并再转换回来,从而降低交互延迟。
OpenAI 早在 5 月份就展示了高级语音模式,展示了一种名为 Sky 的 AI 声音,听起来与 Scarlett Johansson 非常相似。该声音是在未经约翰逊许可的情况下创建和使用的,她最终就此事发表了一份声明。她说,她拒绝了 OpenAI 首席执行官山姆·奥特曼 (Sam Altman) 的多次提议,后者希望约翰逊成为 ChatGPT 的代言人。她说她“感到震惊、愤怒和难以置信”,因为奥特曼创造了一种听起来与她自己的声音“惊人地相似”的声音。OpenAI 声称 Sky 的声音并不打算模仿 Johansson 的声音,但在她聘请法律顾问后,它被删除了。
OpenAI 表示,自从演示了高级语音模式以来,它一直致力于提高语音对话的安全性和质量。高级语音模式以四种预设语音说话,旨在阻止与这些语音不同的输出,从而防止其模仿名人的声音。OpenAI 还“实施了护栏”,以阻止对暴力或受版权保护内容的请求,早期测试将用于在更广泛地推出之前改进该功能。
被授予高级语音模式访问权限的用户将收到一封包含说明的电子邮件,OpenAI 计划滚动添加更多人。Plus 上的每个人都可以在秋季使用高级语音模式。