字节跳动回应“中文版Sora”:目前尚无法作为完善产品落地

物联网界 2024-02-21 11:26:01

在AI视频生成赛道上,新的竞争者正在崭露头角。近日,传闻字节跳动在Sora引爆文生视频赛道之前,已秘密研发一款名为Boximator的创新型视频模型,被视为“中文版Sora”。这款模型在视频生成领域有着独特的技术方法,尤其是其精准控制视频中人物或物体动作的能力,引起了业界的广泛关注。

字节跳动自去年开始积极布局AI领域,并于去年11月成立了专注于AI创新业务的新部门Flow。据了解,字节跳动创始人张一鸣在过去的一年中,几乎将所有时间都投入到了AI业务上,这也从侧面反映了字节跳动对于AI业务的重视和决心。为了加速AI业务的发展,字节跳动正在从全公司范围内抽调精英力量支持Flow部门。

字节跳动在AI技术领域的布局并非一帆风顺。此前,公司CEO梁汝波曾批评公司对于新技术的反应过于迟钝,并指出剪映在处理用户反馈时存在效率低下的问题。这些批评表明,字节跳动在追求技术领先和产品创新的同时,也面临着内部管理和反应机制的挑战。

针对Sora引爆文生视频赛道,字节跳动相关人士进行了回应,他们表示Boximator是一个在视频生成领域控制对象运动的技术方法研究项目。目前,这项技术还在研究阶段,尚未作为完善的产品落地。与此同时,字节跳动也坦诚地承认,与国外领先的视频生成模型相比,Boximator在画面质量、保真率、视频时长等方面还存在一定差距。

Boximator的研发团队利用WebVid-10M数据集进行深度训练,从中筛选出110万段动态明显的视频片段,并为其注释了220万个对象的边界框。在PixelDance和ModelScope这两个模型的基础上,Boximator得以训练并不断完善。尽管目前仍处于研发阶段,但预计将在未来2-3个月内发布测试网站,供公众体验。

与阿里巴巴、百度等互联网大厂相比,字节跳动在AI和大模型领域的布局相对低调。目前,字节跳动Flow部门已经推出了三款AI对话类产品,包括豆包、扣子和Cici,这三款字节系的AI产品均未进行高调的发布和大规模推广,字节跳动官方也未对外公布在AI领域的研发方向和布局。

与此同时,字节跳动旗下的核心视频剪辑产品——剪映,也在AI辅助创作上寻求突破。抖音集团CEO张楠在近期宣布将全身心投入剪映业务,并计划推出一个AI生图和视频的产品。业内观察人士普遍认为,剪映有望在对标Sora的竞争中脱颖而出,而Boximator模型是否将应用于剪映中,目前尚不得而知。

Sora的诞生无疑为AI生成视频工具的市场注入了新的活力。浙商证券分析师认为,短期内,Sora及类似产品将大幅提升图像和短视频的制作效率,改变创意生产及营销工作流,进而提升短视频产品的生产力。随着商业化步伐的加快,这些工具将有可能成为创意产业的重要支柱。

尽管Sora等AI生成视频工具的收费标准尚未公布,但参考其他同类产品,其定价可能相对较高。然而,鉴于Sora采用的世界模拟器技术路径,其边际成本或有降低的可能,这将有助于推动AI生成视频工具的普及和应用。

随着Boximator等创新性视频模型的研发和应用,未来的视频生成领域将充满无限可能。字节跳动能否借助Boximator和剪映等产品,在AI视频生成赛道上迎头赶上并领跑市场,值得业界和消费者共同期待。

0 阅读:1

物联网界

简介:没有人是一座孤岛,未来世界,万物互联!