近日,AI巨头OpenAI又出王炸,推出 Sora后在AI视频领域一举登上行业巅峰。
据悉,OpenAI发布的视频生成式AI模型Sora,该模型可根据文本信息生成时长达60秒的连贯视频。这是 AI 大模型直接生成的效果,再次点燃外界对于人工智能的畅想。
OpenAI再次引领AI行业发展
Sora的横空出世之所以能引起如此大的震撼,原因:
1、是时长。此前火热的Pika视频仅支持生成一段3秒的视频,Runway公测版本视频时长仅为4秒,网页版最长也仅支持18秒的视频生成,而Sora可生成长达一分钟的视频。
2、是多角度。得益于更长的生成视频时长,Sora可以实现“运镜”,即在一段视频中围绕同一主体实现远景、中景、近景、特写等不同镜头的切换。
3、是理解真实世界的能力。Sora对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
可以预见的是,Sora的横空出世,无疑将促使人工智能引领新一轮行业变革。不少机构预计,2024年将是多模态大模型快速发展的一年。
平安证券表示,Sora的发布意味着AI在视频技术领域取得突破性进展。浙商证券表示,2024年海内外厂商有望发布更加复杂的多模态大模型,实现文本、语音、图像及音视频等多模态数据的复杂处理和交互。
信达证券指出,受益于全球生成式 AI 持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效。
行业变革前夜,市场相关概念股或进入爆发期
特斯拉(TSLA.US)
Sora的横空出世引发科技圈热议。特斯拉创始人马斯克在社交平台连发多条动态称:“被人工智能增强的人类,将会在未来几年之内创作出最杰出的作品。”
并且日前,在社交媒体X用户“DrKnowItAll”的一则分析比较OpenAI Sora和特斯拉FSD V12的推文下,马斯克直接表示,“特斯拉在大约一年前就能以精确的物理原理生成真实世界视频,特斯拉已掌握Sora类似技术。
Meta(META.US)
2 月 17 日消息,Meta 首席 AI 科学家 Yann LeCun 在 2022 年推出了 JEPA模型架构,次年基于 JEPA 架构开发了一款“I-JEPA”图片预测模型,目前又推出了一款名为“V-JEPA”的视频预测模型。
据介绍,相关 JEPA 架构及 I-JEPA / V-JPA 模型主打“预测能力”,号称可以以“人类理解”的方式,利用抽象性高效预测生成图片/视频中被遮蔽的部分。研究人员还使用一系列经过遮蔽处理的特定视频训练 I-JEPA / V-JEPA 模型,进一步预测未来的事件或动作,进而达到对世界更深层次的理解。
谷歌(GOOG.US)
谷歌在去年12月21日发布一个全新的视频生成模型VideoPoet,能够执行包括文本到视频、图像到视频、视频风格化等操作。此外,今年2月,谷歌公司宣布“巴德”更名为“双子座”(Gemini)。这是一款多模态大模型,可理解和组合文本、代码、音频、图像和视频等不同类型的信息。
亚马逊(AMZN.US)
亚马逊还发布了Create with Alexa,可以设置如屏幕、摄像头、后腔设计等,这是一个专门生成基于提示的短格式动画儿童内容的模型,支持空间音频功能。未来,新版 Alexa 将会适用于亚马逊旗下所有 Echo 系列终端产品,并且还能将大模型与端侧搭载的摄像头、麦克风等传感器检测到的非语言数据相结合,进而为用户带来全新的AI交互体验。
微美全息(WIMI.US)
资料显示,微美全息积极参与开启AI变革创新时代。基于过去丰富的行业和细分场景的业务经验,从几年前就开始研发AI视觉大模型,包括视频大模型、音视频大模型、图片大模型、语言大模型组成,聚焦数字创意垂类创作场景。
此外,微美全息通过运用生成式人工智能、大数据等技术,对采集到的数据进行分析、特征学习和样本训练,提升了对文本、图片、音频、视频等多模态数据的处理分析能力。未来,微美全息将进一步强化核心技术优势,提高产品竞争力,与行业伙伴齐头并进推动行业进步。
总结
毫无疑问,Sora有望引领AI新一轮景气度,产业链投资价值持续显现。随着技术的不断进步和应用场景的不断扩展,AI文生视频/图生视频等赛道将会继续保持快速发展的趋势,相关领域及产业在其带动下将迎来深度变革。
从技术突破的角度来看,或许未来一两年内,这个领域将会出现更多的创新和突破,包括更加智能的视频生成技术、更加丰富和多样化的应用场景以及更加完善和成熟的技术标准和商业模式等。
混蛋,我们又不能买,你发这个干啥?