谷歌向安卓用户推出语音驱动的AI聊天功能

黑客部落 2024-09-14 16:36:44

谷歌面向安卓用户推出语音驱动的AI聊天功能

Gemini Live允许进行双向对话,现已免费向所有安卓用户开放。

周四,谷歌将其语音驱动的AI聊天功能Gemini Live免费向所有安卓用户开放。该功能允许用户通过语音命令与安卓设备上的Gemini进行互动。

这一点尤为重要,因为竞争对手OpenAI的ChatGPT高级语音模式功能(与Gemini Live类似)尚未全面推出。

谷歌在上月的Pixel 9发布会上首次展示了Gemini Live。最初,该功能仅对Gemini Advanced订阅者开放,但现在任何使用Gemini应用或其安卓覆盖层的用户都可以访问。

Gemini Live使用户能够大声提问,甚至可以在AI回复过程中打断其话语。用户还可以从多种语音选项中选择Gemini的回复语音,增加了互动的个性化程度。

在官方帮助文档中,Gemini建议以下几种语音模式的使用方式:

双向对话:无需打字即可与Gemini对话,Gemini将以语音回复。大声头脑风暴:询问礼物创意、活动策划或商业计划等。探索:发现更多你感兴趣的话题的详细信息。大声练习:以更自然和对话的方式为重要时刻做练习。

有趣的是,虽然OpenAI在5月与GPT-4o的发布一起演示了其高级语音模式,但直到7月底才向部分用户推出这一功能。

一些AI专家推测,更广泛的推出可能受到计算能力不足的限制,因为语音功能可能非常消耗计算资源。

据报道,要访问Gemini Live,用户可以点击应用或覆盖层右下角的新波形图标。此操作将激活麦克风,允许用户以语音提问。

界面还包括“保持”Gemini回答或“结束”对话的选项,让用户可以控制互动的流动。

目前,Gemini Live仅支持英语,但谷歌已宣布计划在未来扩展语言支持。公司还打算将这一功能引入iOS设备,尽管尚未提供具体的时间表。

0 阅读:0

黑客部落

简介:计算机安全技术分享,网络安全攻防技术分享