“不务正业”搞AI虚拟人,淘宝社交之心不死?

科技旋涡 2024-03-20 14:05:33

作者 编辑|高乐

从各大直播间的虚拟人,到双十一时各种大大小小的元宇宙空间,自元宇宙兴起时,淘宝就一直在入局元宇宙的边缘疯狂试探。

虽然如今复盘,在众多大平台中淘宝并不是元宇宙声量最大的那个,但在元宇宙浪潮消退后,淘宝人生这个一直不温不火的虚拟分身板块却成为了为数不多坚持到如今的元宇宙阵地。

而随着这个诞生于2019年的应用借助AIGC的兴起迭代到2.0版本,关于AI虚拟人可能存在的另一条发展路径,也在淘宝的探索下变得越来越清晰。

在同行夹击下依旧在“不务正业”的淘宝,搞AI虚拟人的目的究竟是什么?

1 迭代中前进,稳稳的幸福

自2019年中上线以来,淘宝人生先后推出了两个版本,淘宝人生1和淘宝人生2。

淘宝人生2作为淘宝人生1的延续,相比于之前的卡通风格更偏向于超写实风格,同时淘宝人生2也是市面上少有的将超写实风格落地到移动端的装扮类应用,这与市面上QQ秀等同类产品从2D到3D的发展路径如出一辙。

虽然在主流视野中淘宝人生的存在感一直有限,但依托淘宝4亿用户的淘宝人生依旧是目前国内用户规模较大的虚拟人装扮类应用,围绕淘宝人生已形成了具有一定规模的活跃圈层:

淘宝人生的微博超话目前有3.9万粉丝,相关话题在小红书上的浏览量也达到近1500万,许多网民自发分享着自己在淘宝人生中关于穿搭、关于捏脸的心得体会;官方在不同社交媒体上的账号也在定期更新着上新公告与版本介绍等内容。

同时作为一款内置在淘宝中最初为用户提供虚拟分身的应用,淘宝人生经过多年的发展已经在捏脸、换装的基础上衍生出许多其他功能。其中与AI强相关的首先虚拟人NPC等功能,内置的“涂山赫言”“海梦学姐”等虚拟人NPC,前者可以为用户计算每日运势,后者可以进行日常交流。

同时基于淘宝作为购物平台的特点,淘宝人生还提供了许多基于购物的AI相关的玩法:

比如购买淘宝实体服装后,可以为用户生成一套该样式的虚拟服饰资产并穿搭到自己捏好的虚拟形象中;照片风格化可以将捏好的形象二次创作,实现类似妙鸭相机的功能;此外,用户也可以通过AI服饰涂鸦的方式自制服装。

随着一步步探索淘宝人生背后应用的AI技术,关于“不务正业”的淘宝在元宇宙领域的野心,也变得越来越清晰。

2 AI服饰涂鸦,方向对了

在淘宝人生的诸多AI功能中,最能引起元宇宙新声好奇的就是AI服饰涂鸦功能。

这项功能允许用户通过自由涂鸦或输入文本描述,在选定的底图上创作服饰,随后利用AIGC算法技术转化为高质量的图像,实现用户创意的可视化——可以说确确实实满足了一把为虚拟分身穿上心仪服饰的瘾。

作为当前虚拟人领域较为少见的定制化功能,AI服饰涂鸦背后依托的是一系列先进技术,包括Stable Diffusion、ControlNet和LoRA等。

Stable Diffusion技术通过变分自编码器和扩散模型结合,基于文本描述生成高质量图像,为AI服饰涂鸦提供了强大的图像生成能力。ControlNet技术进一步增强了图像生成的精确性,允许更细致地控制生成图像的结构和布局,确保用户涂鸦的细节得以精准呈现。LoRA技术则通过对模型进行微调,优化了特定风格化任务的处理效率,减少了对算力和数据的需求。

此外,AI服饰涂鸦项目采用了基于diffusers库的SD生图框架,提高了图像生成的效率,并通过模型管理和服务部署的优化,提供了稳定高效的在线服务体验。中心化的请求服务器策略优化了负载均衡,确保了服务的快速响应和稳定性。

通过这些关键技术的集成和优化,AI服饰涂鸦功能可以在保证用户创作出高质量且具有个性化的服饰图像的同时,确保用户体验的稳定性和高效性。正是这一功能,在最初引起了元宇宙新声对于淘宝人生的关注。

而除了AI服饰涂鸦这一功能外,在传统的捏脸与换装领域,AI对淘宝人生的介入同样越来越深入。

作为几乎所有元宇宙应用都躲不开的功能,捏脸功能的质量决定了应用能否在第一时刻就吸引用户——在淘宝人生,用户可以通过上传一张照片快速生成专属于自己的3D数字人形象。

在预处理阶段,系统首先确保上传的图片符合要求,排除不合格和敏感内容。接着,通过五官关键点检测为后续的3D建模提供必要的数据支持。利用3D Morphable Model(3DMM)技术,将2D照片中的人脸特征转换到3D模型上,这一步骤不仅重建了用户的3D人脸,还能将真实人脸特征迁移到淘宝人生2的3D卡通形象上,实现风格化同时保留用户的独特特征。

此外,非面部属性模块通过细粒度分类,如眼镜、发型和眉型,进一步提高个性化和整体相似度。最后,所有这些数据和素材ID结合起来,通过渲染引擎生成最终的3D数字人形象。

为了评估技术成果,淘宝人生采用了Normal Mean Error(NME)指标并结合主观评价进行打分,以此衡量3D数字人形象与原始图片的相似度。

如何将真实人脸特征与风格化3D模型融合的问题,一直是虚拟人捏脸领域的挑战,但淘宝人生通过采用3DMM和图形学变形技术以及MLP映射模型,让这一难题得到了一定解决。

而在去年妙鸭相机掀起一波AI写真热潮后,淘宝人生也开始在相关功能上精进:

在当前,AI写真主要依赖两种策略:一是基于角色的LoRA训练,通过收集和训练定制人物的大量图像来表达角色身份;二是基于图像特征的注入,这种方法可以避免复杂的训练过程,快速生成所需图像,适合迅速获得结果的应用场景。

而淘宝人生的AI写真算法实施过程分为三个核心步骤。首先,图像预处理阶段包括美肤和人脸增强处理,以及对人脸和头发区域的分割和裁剪,为图像生成做好准备。

接下来,在图像生成模型阶段,通过LoRA训练和图像特征的注入控制生成图像的身份信息,特别是改进的参考图注入技术,优化了生成过程,确保了图像质量和身份一致性。

最后,在模型后处理阶段,从生成的图像中筛选出质量最高的图片,并利用人脸融合算法和图像超分辨率技术进一步优化结果,保证了最终图像的高质量和身份一致性。

目前淘宝人生已构建起约50种不同风格的模板库和LoRA模型库,使用户能够根据特殊节日或活动选择独特风格。

分析到这里其实不难看出,随着元宇宙与AI技术进步与应用普及,过去困扰个人虚拟人发展的种种挑战,如用户接受度、社交互动的真实感以及对于个性化、多样性的需求等正逐步得到解决。

从AI服饰涂鸦再到AI捏脸与AI写真,依托平台优势,淘宝人生已经为虚拟人的发展做出了许多具有现实意义的探索。

3 淘宝人生虽强,但社交之路漫长

在迭代到2.0版本后,淘宝人生的超写实风格设计,提高虚拟形象的逼真度的同时增强了用户在社交互动中的情感共鸣。此外虚拟服饰资产生成、AI NPC互动等功能的加入也增加了用户间的互动性和趣味性,进一步提升了用户在与虚拟人社交互动时的真实感。

淘宝人生在个性化和多样性方面做出的尝试,可以说对当下虚拟人的发展最具有借鉴意义:

通过AI涂鸦等功能,用户就可以高度定制化自己的虚拟形象;同时将真实商品的虚拟版本融入虚拟形象中的设定,更是让淘宝人生在虚拟与现实两个维度实现了交融。

可以说这是目前淘宝人生虚拟人最大的优势,亦是其他个人虚拟人平台最大的短板。而虚实交融间,隐藏在淘宝人生之下淘宝对于社交的野心已经无需多言。

不过淘宝人生虽在个人虚拟人发展领域已经算是优秀的存在,但距离可以引领淘宝转型社交还有很长的路要走。

近年来,淘宝一直想努力突破其作为购物平台的角色,向更加丰富的社交和娱乐功能扩展——毕竟即便是极为成功的购物App,也难以确保消费者的每日访问,但增加游戏和社交功能能有效提高用户活跃度和对平台的依赖。

从每年双11的好友PK到曾经风靡一时的“叠猫猫”活动,再到更早之前引进旅行青蛙的国内版本,淘宝一直想通过团队合作和游戏化设定,提高用户间的社交联系和对平台的忠诚。

但在被某多多和某东前后夹击的当下,淘宝真的是因为社交属性的匮乏才缺乏逆转局势之力的吗?

与此同时,在SOUL等提供类似功能的应用热度逐渐消退后,淘宝人生自身能在多大程度上保持现状,保证平台具有一定活力也是一个不得不面临的问题。

虽然官方并没有披露淘宝人生较新的日活数据,但目前已经形成的稳定圈层,不论在影响力还是知名度上,较之淘宝庞大的用户数量未免还是有些太小。

不过好消息是,在淘宝人生社交平台官方账号的评论区许多用户都在积极与官方交流,表达想法、传递意见,这样一个已经形成的稳定圈层就是淘宝继续耕耘社交领域的底气。

同时,已经在AI虚拟人领域做出大量技术探索的淘宝人生只要可以保持迭代,对元宇宙可能迎来的复兴,就也是一个不错的消息。

0 阅读:35

科技旋涡

简介:在这里,看懂科技