Sora发布以来,中国团队在干什么?

诗与星 2024-02-26 11:21:10

今天谈谈红到发紫的Sora。

作为对AI尤其是AI绘画和AI视频有所涉猎的星空君来说,并不认为Sora在技术上有过高的划时代意义。

因为Sora并没有建立在不能理解的技术路线之上,它的成功,受益于资本的持续投入,某种意义上讲,是大力出奇迹的结果:它能在一个商业化场景并不明朗的技术路线上狂烧几十亿上百亿美刀。

这种不计代价的投入,连谷歌都要肝颤。

发布了ChatGPT的OpenAI并没闲着,夜以继日的工作,在2024年2月15日发布了文生视频工具Sora。

AI届的汪峰--谷歌几乎同时发布了Gemini 1.5 ,虽然比它的上一个版本强大了太多,但被淹没在Sora的欢声笑语里。

与此同时,著名的Stable Diffusion所属公司Stability AI接连发布了StableCascade和Stable Diffusion 3。

在真正的AI圈里,Stability AI发布的两大新产品引起了轰动。但在大众圈里,几乎没有声息。

原因很简单,StableCascade和Stable Diffusion 3都需要很高的理解和操作门槛。

Sora发布的第二天,我用comfyUI调通了StableCascade。

这是我用StableCascade大模型画出的第一张图,StableCascade默认大模型的体积高达34G,12G的3060明显跑不动了,你听,显卡在咆哮!

说个搞笑的事,OpenAI是close(闭源)的,Stability AI才是open(开源)的。

闭源意味着成本和审查。

有多少Stable diffusion爱好者,买显卡,搭机器,装程序,调插件,不过是为了涩涩自由。

有人认为只有中国才有审查,国外尤其是美国是言论自由的。

大人,时代变了。

在96种性别的美利坚,审查已经渗透到了骨子里。

这是Gemini 1.5画的图:

当然你也可以和ChatGPT聊一聊尼格和西瓜的故事,以及犹太人的阴暗面,看看它有没有审查。

2月22日,字节跳动发布了基于Stable Diffusion的SDXL-Lightning大模型。

SDXL-Lightning是在Stable Diffusion开源基础上进行的开发,和普通的SDXL大模型相比,速度快了差不多20倍,和Turbo(官方)、LCM(清华团队)技术的大模型相比,也要快了4、5倍。

关键是,质量还非常好。

这就意味着,更低的成本。

要知道,Sora是用几十亿美金的显卡烧出来的,而StablI Diffusion只需要跑在几千块的消费级显卡(当然最好是用1万块的4090)上。

几乎是同时,著名的中国大模型创作团队,在字节SDXL-Lightning的基础上,发布了第一款基于SDXL-Lightning技术的HW5.0_Euler_a_Lightning。

使用该模型,我生成了这张图片,这张图片虽然很朴素,但在不到3000块的显卡上,只用了2秒钟。

他们把字节的大模型进行了优化,普通的Stable Diffusion用户可以使用已有的客户端就可以跑起来。尤其是适用面最广的WebUI(字节刚发布的时候只支持comfyUI)。

目前开源技术已经能够很好的支撑3-4秒的视频(但我的显卡不能很好的支撑,还需要砸锅卖铁换4090),通过这些优秀的大模型的迅速迭代,意味着将在很短的时间内,开源工具完全可以抵达Sora的水平。

李彦宏有句话说完就被骂,但我觉得非常对,大致意思是不要卷大模型底座了,卷应用才是正道。

现在字节的做法,就是正道。

那么问题来了,字节为什么搞AI绘画大模型?

其实字节旗下的抖音、Tik Tok等平台积累了大量的视频、图片素材,这些素材经过训练后,可以爆发出惊人的应用场景:只需要拖拖拽拽就可以轻松的生成数字人。

我用Stable Diffusion的InstantID插件给好友画了一张AI照片,结果她反而说抖音特效有的是。

抖音在生成特效的时候,其实已经拿用户的图片、视频去训练了。

经常有人悲鸣,美国有了ChatGPT,美国有了Sora,中国错过了第四次工业革命。

其实不是的。

你看谷歌都搞不过OpenAI,如果你把中国的大模型和谷歌对比,然后会发现差距没那么明显。

OpenAI是个异类,我一直评价它剑走偏锋大力出奇迹。

好处是它确定了既定方向后,其余的企业可以沿着这个方向不会迷路。

现在ChatGLM等国产生成式大模型已经接近甚至超越ChatGPT3.5的水平,继续训练下去,达到4.0的水准只是时间问题,这个时间不会太久。

工业革命不可能只靠OpenAI,除了Sora还有Stable Diffusion,先不说绝大部分AI团队里都有大量的华人,以腾讯、阿里、字节为代表的中国团队在开源领域的贡献非常多。

腾讯团队为ControlNet开发了一系列高效快速的模型,阿里团队的换装插件深受欢迎,小红书团队也贡献了他们的大模型。

连日本人都感到惊叹:AI领域的中国人太多了!

和前几次工业革命不同的是,中国现在本身就是工业革命的一部分,甚至是头部,压根没有落下。

很快我们将迎来一个全新的时代,你的美貌、声音、身材不再是优势,AI都可以完美取代。

而AI取代不了的,是持之以恒的思考、领先时代的思想,和持续创作的能力。

0 阅读:34

诗与星

简介:感谢大家的关注