OpenAI推出首个视频生成模型:一句话生成1分钟高清视频

墨仙子的科技簿 2024-02-18 17:45:55

亲爱的读者,谢谢一年来的支持,愿大家新年万事如意,幸福安康!点赞,关注,转发,数码领域你不迷路!OpenAI最新发布了一款名为Sora的视频模型,它是继DALL·E 3之后的又一力作。这款模型继承了DALL·E 3的画质和遵循指令的能力,但它的特别之处在于只需输入文本描述,就能生成一段长达1分钟的高清流畅视频。这真是让人叹为观止!

Sora模型能够深度模拟真实世界,这标志着人工智能在理解真实场景并与之互动的能力方面迈出了重要的一步。想象一下,以前只能在想象中看到的场景,现在可以通过Sora模型呈现在我们面前了。从官方公布的生成视频来看,以中国龙年春节为提示词生成的视频真是热闹非凡!人群中有人在舞龙,舞龙动作相当丝滑标准,还有人举起手机拍摄,场景细节丰富。另外,还有一段名为“都市丽人”的视频,展示了东京雨后街头的景象,路面上的水渍倒影逼真,霓虹灯的效果堪比实景。要是没有标注说明,很多人可能都会以为这是真实拍摄的视频片段呢!OpenAI表示,他们的技术团队正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要与现实世界进行交互的问题。这个生成视频的功能仅仅是整个计划的一小部分。据悉,Sora模型已经能够生成具有多个角色和特定运动的复杂场景,它不仅能理解用户在提示中提出的要求,还能理解这些物体在物理世界中的行为方式。

不过,Sora目前还有一些局限性。OpenAI表示,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。有时候,模型可能会混淆提示中的空间细节,比如左右的方向,而且可能难以精确描述随着时间推移发生的事件,比如遵循特定的相机轨迹。

即便如此,OpenAI的首款视频模型发布后,许多网友都对此感到惊讶。有人调侃说:“不少人要丢工作了”,“整个素材行业可能都会因此衰落”,还有人表示:“语言大模型之后,OpenAI又要一次加快AI进化”。看来Sora的问世确实给人们带来了很大的惊喜和讨论!

0 阅读:0

墨仙子的科技簿

简介:感谢大家的关注