GPT-4o发布，多模态模型引领AI应用新时代！多家上市公司加速推进AI应用落地

近日，OpenAI发布了新一代旗舰生成模型GPT-4o，这是一个具有文本、语音、图像三种模态理解力的全新大模型。据悉，GPT-4o将免费提供给所有用户，OpenAI还将推出桌面版ChatGPT，轻量化的使用体验可以融入任何工作流程中。这个消息引起了全球大模型厂商的激烈竞争，谷歌、百度、商汤科技等公司纷纷发布了最新的多模态模型成果。

GPT-4o有四大特点：一是多模态能力大幅提升，可以跨文本、音频和视频进行实时推理；二是更加“像人”；三是毫秒级响应，API（应用程序接口）成本更低；四是拥有3D视觉内容生产能力。这些特点使得GPT-4o在客户服务、医疗保健、教育、娱乐、无障碍技术等诸多领域发挥重要作用，助力相关领域的AI应用“更加好用，性价比更高”，更好地打开应用商业化空间。

全球大模型竞争加剧，各家公司纷纷跟进AI应用布局。多模态模型可以应用于各种终端设备，如智能手机、平板电脑、车载多媒体端口、智能音箱、机器人等。此外，还可以应用于企业级产品，如影视、教育、营销、搜索、办公等各个领域。

在此背景下，不少上市公司通过大模型加速推动在AI领域的业务布局与应用。例如金蝶集团发布基于企业管理、AI、大模型三者叠加结合的金蝶Cosmic；因赛集团自研的营销行业AIGC应用级模型InsightGPT不断取得技术突破；奥飞娱乐持有光年无限5%股权，并上线AI对话小程序“喜羊羊与灰太狼+”；字节跳动也最新发布了豆包大模型。

中国信息协会常务理事朱克力表示：“拥有多模态能力的大模型将为上市公司在客服服务、教育培训和终端应用等领域提供了广阔的应用前景。这种全新的交互模式将为企业带来更高的效率和更低的成本，同时为用户带来更便捷与愉悦的体验。”

在这个大模型时代，各家公司都在积极探索如何将大模型应用于实际业务中，以提高效率、降低成本、提升用户体验。在这个过程中，拥有多模态能力的大模型将成为关键因素。

首先，多模态能力使得大模型可以应用于各种终端设备和企业级产品。这意味着大模型可以在更广泛的领域发挥作用，为更多企业提供支持。例如，在教育领域，大模型可以通过语音、图像等多种方式与学生进行互动，提高教学效果；在医疗领域，大模型可以通过分析患者的语音、图像等信息，辅助医生进行诊断。

其次，大模型的实时推理能力使得其可以快速响应用户需求，提高服务效率。这对于客户服务等需要快速响应的领域尤为重要。此外，大模型的低成本API也使得更多企业能够负担得起使用大模型的费用。

最后，大模型的3D视觉内容生产能力也为一些新兴领域提供了新的发展机遇。例如，在虚拟现实（VR）和增强现实（AR）领域，大模型可以通过生成逼真的3D视觉内容，为用户提供更加沉浸式的体验。

总之，在这个大模型时代，各家公司都在积极探索如何将大模型应用于实际业务中。拥有多模态能力的大模型将成为关键因素，为上市公司在客服服务、教育培训和终端应用等领域提供了广阔的应用前景。这种全新的交互模式将为企业带来更高的效率和更低的成本，同时为用户带来更便捷与愉悦的体验。

阿里云发布“地表最强”大模型, 通义千问实力比拼GPT-4

【2点赞】

7个免费 AI 工具, 10倍提升自媒体内容创作和工作效率

【66点赞】

幸福双城资讯网

GPT-4o发布，多模态模型引领AI应用新时代！多家上市公司加速推进AI应用落地

阿里云发布“地表最强”大模型, 通义千问实力比拼GPT-4

7个免费 AI 工具, 10倍提升自媒体内容创作和工作效率

安康符一静儿