这两天的AI人工智能界热闹了,OpenAI刚发布了其最新的模型GPT-4o,展现了AI领域的最新进展。谷歌紧接着在2024年的Google I/O开发者大会上,展示了一系列令人惊叹的人工智能(AI)产品和工具。这些发布的内容预示着AI未来在普通人的生活、工作中会出现哪些令人期待的产品。
OpenAI最近发布了他们最新的模型,名为GPT-4o。这个名字中的 'o' 代表 'omni',意味着 '所有'。这是一个全能的 AI的发展方向,可以处理文本、语音、图像和视频。”这是他们目前最先进的AI系统,具有以下主要特性:
创新性和协作性GPT-4o比以往任何时候都更具创新性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本,或学习用户的写作风格。
长文本处理能力GPT-4o能够处理超过25,000个单词的文本,适用于长篇内容创作、扩展对话以及文档搜索和分析。而且它还具有更广泛的通用知识和问题解决能力,能够解决更加复杂的问题。
多模态输入和输出GPT-4o可以接受任何组合的文本、音频和图像作为输入,并生成任何组合的文本、音频和图像输出。特别是视觉输入GPT-4o可以接受图像作为输入,并生成标题、分类和分析。同时在视觉和音频理解,GPT-4o在视觉和音频理解方面表现得更好,能够更准确地处理和生成相关内容。
提升性能降低成本GPT-4o在英文和代码文本上的性能与GPT-4 Turbo相当,但在非英文语言的文本上有显著改进,同时速度更快,API成本降低50%。加上快速响应时间,GPT-4o可以在短至232毫秒的时间内响应音频输入,平均响应时间为320毫秒,与人在对话中的响应时间相似。不再是你问完后就一直傻傻等它说完。它反应会更快而且你可以中途打断。
未来Open AI在AI产品的降本增效上还会有更多动作。Open AI的这场发布会应该是特意抢在了谷歌的Google I/O开发者大会前一天发布。从这个动作足以看出目前他们的竞争已经完全拉开了架势。那我们再来看看2024年的Google I/O开发者大会中谷歌都展现了哪些他们的新AI产品
AI Agents:您的个人AI助手Google正在研发AI Agents,一个旨在创建个人AI助手的项目,帮助用户完成各种任务。这个雄心勃勃的项目旨在提供实时帮助,例如定位眼镜、审查代码以及回答特定产品相关的问题。愿景是开发出类似于漫威宇宙中托尼·斯塔克的全知AI助手J.A.R.V.I.S。
Gemini:提升创造力和生产力Gemini是一种利用生成式AI来增强用户创造力和生产力的新助手。它可以更好地理解屏幕上的内容和你正在使用的应用的上下文。例如,你可以在Gmail、Google消息等应用中拖放生成的图片,或者点击“询问此视频”来在视频网站的视频中找到特定信息。
Circle to Search:简化作业帮助Google推出了Circle to Search,这是一种新的搜索功能,旨在帮助学生解决作业中的问题。当学生在手机或平板电脑上圈出他们卡住的问题时,他们将得到一步步的指导,以解决一系列的物理和数学问题。
Firebase Genkit:AI驱动的应用开发Firebase Genkit是Firebase平台的新成员,使开发人员能够更容易地在JavaScript/TypeScript中构建AI驱动的应用,Go的支持也即将推出。
LearnLM:用于学习的AIGoogle公布了LearnLM,这是一种新的生成式AI模型,专为学习而“微调”。LearnLM模型旨在通过“对话式”互动辅导学生学习各种科目。
Music AI Sandbox:使用AI创作音乐Google推出了Music AI Sandbox,这是一种可以帮助音乐创作者使用AI技术来创作音乐的工具。它可以生成不同风格和节奏的音乐,让创作者能够快速生成音乐。很早以前Google就有透露他们在AI音乐上的研发。
Veo:高质量视频生成Google推出了Veo,这是一种强大的视频生成模型,可以生成高质量的1080p分辨率视频,时长超过一分钟。Veo理解电影术语,如“延时摄影”或“风景的航拍镜头”,并且可以创建一致和连贯的镜头,使得人物、动物和物体在镜头中的运动更加真实。相信知道的朋友的这个是针对Sora来的。
AI Teammate:提升团队协作Google在其Workspace中展示了AI Teammate的新功能。AI Teammate可以被添加到Workspace中,帮助团队更高效地完成任务。未来我们可能都要开始习惯有AI员工的存在。
AI Overviews:总结搜索结果在搜索领域,Google推出了AI Overviews,这是一种新的搜索功能,可以为用户提供AI生成的概览或摘要,直接在搜索结果中显示。这一功能旨在为复杂查询提供更全面的答案。
未来AI人工智能的双雄对决正式拉开了。两大科技巨头在AI领域的最新进展都是令人兴奋的。Google的创新产品和工具,以及OpenAI的最新模型GPT-4o,不仅展示了AI的强大能力,也预示了AI将如何改变我们的生活和工作方式。今天就做个最初步的信息分享,后面我们做具体的我们分析和主观预测。