图像编辑开源新SOTA大模型行业正步入多模态时间
全球AI大模型智能涌现,现在正在进入“多模态时间”。
一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。
另一方面,AI应用和落地的需求中,多模态也是最重要的能力。没有多模态技术,何谈应用和落地?
实际上,多模态的先锋共识和趋势,把代表性玩家的进展连点成线,也能看出来……
看看行业公认的多模态卷王,阶跃星辰——
刚刚过去的一个月,陆续上新的3款模型,全是多模态,有图生视频开源模型,有多模态推理模型,还有图像编辑开源模型。
模态丰富,上新频繁,性能出色。
之所以把阶跃的这些发布连点成线解读,也是因为阶跃从一开始的强落地和强应用属性。
目前,阶跃已发布的模型里,七成都是多模态。鉴于多模态是Agent的必备要素,今年阶跃化身「落地型玩家」的态势愈发明显:发力智能终端Agent。
过去一个月,卷王卷出了些啥?
据量子位整理回顾,过去一个月,阶跃星辰接连上新了3款模型:
- Step1X-Edit:图像编辑模型
- Step-R1-V-Mini:多模态推理模型
- Step-Video-TI2V:图生视频模型
它们覆盖了当前多模态模型的几大刚需方向,并且其中Step1X-Edit和Step-Video-TI2V已面向开发者开源。
怎么说呢,这很阶跃,也很符合技术流和行业玩家们对“多模态时间”的追逐趋势。
而这三款模型的具体情况,咱们掰开了来看: