视觉影像制作的革命性时代来了?OpenAI发布首个视频生成模型

SevenTech 2024-02-16 17:44:00

OpenAI刚刚发布了Sora,这是一款由人工智能驱动的工具,可以从文本生成视频,是OpenAI首个视频生成模型。虽然我们已经在网上看到了几个文本到视频生成模型,但Sora将这个概念提升到了一个全新的水平,因为它可以创建非常逼真的视频。

OpenAI首席执行官Sam Altman在X(以前的Twitter)上发布了几个sora生成的视频样本,给整个AI社区留下了深刻的印象。根据OpenAI公司的演示,用户可以在Sora上输入一段文字指令,瞬间生成长达1分钟有电影质感的逼真视频。

全世界的影像制作行业被强烈震撼,很多人惊呼:视觉影像制作的革命性时代真的到来了。

Sora 是什么?

虽然OpenAI没有透露Sora背后的视频模型的技术,但该人工智能工具可以生成具有多个运动(行动)角色的复杂场景。

Sora可以制作长达60秒的视频,其中包括非常详细的场景、复杂的镜头运动和多个充满活力的角色。该工具还可以从文本提示中解读情感,并在视频中表达出来。

镜头穿过熙熙攘攘的东京城市街道,美丽的樱花花瓣随着雪花在风中飞舞。

目前,由OpenAI选择的一小部分创建者可以使用Sora。一般用户无法使用该服务,甚至OpenAI工具的付费订户也无法使用该服务。该公司表示,这只是向世界展示人工智能能力的研究预览。

在宣布Sora的时候,Sam Altman同时请用户对这个工具的演示提出建议。人们想出了创意和复杂的提示,但Sora已经超出了所有人的期望。

在ChatGPT之后,Sora将是OpenAI的下一个重大发展。这样的进步速度完全是AI式的,它让一些在评论区留言的网友忍不住幻想:有一天,也许不会太久,把一个剧本输入进去,一部电影就能够自动生成了。

这个概念很吸引人,但同时也令人担忧。Sora在内容创作、电影制作、动画制作等方面有着无穷无尽的应用,但也可能以同样多的方式被滥用。因此,OpenAI表示,Sora将实施多种安全措施。它将过滤掉可能有害的提示。这包括与暴力、成人媒体、名人相关的深度造假和其他知识产权有关的内容。

几周前,谷歌还展示了其名为VideoPoet的文本转视频生模型。它的工作原理类似于Sora,但也可以生成音频内容。然而,这两项服务尚未向公众开放。

OpenAI还没有宣布Sora的实际发布日期。该公司表示,人工智能视频生成器仍在开发中和优化当中。Sora的出现是人类AI技术新的里程碑,OpenAI将如何在保证网络安全的情况下完成这个项目,这将是一件值得深思的事情。

尽管OpenAI表示,Sora仍存在一些弱点,比如它在准确模拟复杂场景的物理现象方面仍存在困难,可能不理解特定的因果关系,会搞错左和右,以及在准确体现随时发生的事件方面遇到困难等等,这些问题将在正式发布时解决。

喜欢点赞收藏!欢迎关注SevenTech!

0 阅读:3

SevenTech

简介:资深科技自媒体,Seven哥说科技.