大家好,我是立志替大家出手的AI区(表情包区)UP主Glen。
最近AI数字人领域越来越火热,各家大厂又又又打起来了!我竟然还有点小兴奋。
之前给大家【全网首发】分享了阿里推出的“开源最强”数字人EchoMimic,效果那是相当炸裂!经过我和小伙伴们的评测,EchoMimic生成的数字人真的是目前开源最强的!
我们直接来看一个数字人横向的对比图:
最强️在这里
但我万万没想到,官方竟然是肝帝!
最近直接更新了一波,发布了新版支持Audio Driven加速模型,推理速度直升10 倍!
那我当然是果断出手,周末加班给大家安排一波10倍速EchoMimic数字人!
EchoMimic:数字人技术的新突破数字人技术,这个曾经只在科幻电影中出现的概念,如今正一步步走进我们的现实生活。随着AI技术的飞速发展,开源数字人技术的竞争愈发激烈,各大厂纷纷亮出自家的王牌产品。
这不,继百度的Halo、快手的LivePortrait之后,阿里也重磅推出了他们引以为傲的数字人——EchoMimic。
EchoMimic的诞生,不仅仅是阿里在数字人领域的一次尝试,更是对现有技术的一次革新。传统的肖像动画技术,要么依赖音频驱动,要么依赖面部关键点驱动,各有利弊。
而EchoMimic则巧妙地结合了这两种驱动方式,通过音频和面部关键点的双重训练,实现了更加逼真、自然的动态肖像生成。
EchoMimic的创新之处在于其新颖的训练策略。它不仅可以独立使用音频或面部关键点生成肖像视频,更可以通过音频和选定的面部关键点的组合,创造出更加丰富、细腻的动态效果。
而近期发布的新版更是支持Audio Driven加速模型,最快可以做到10倍提速!
免费离线懒人包:EchoMimic为了让更多人能够轻松体验到EchoMimic的魅力,我当然是:无所谓,我会出手.jpg,为大家准备了一个免费整合包。
你只需下载到本地,解压并双击“一键启动”,系统就会自动运行并打开一个简单的用户界面。
使用步骤更是简单到不行:
1. 输入图片:选择你想要生成动态视频的肖像图片。
2. 输入音频:提供与图片匹配的音频文件,EchoMimic会根据音频内容驱动肖像的动态效果。
3. 点击提交按钮:接下来,就是见证奇迹的时刻。
稍等片刻,你就可以在界面右侧看到由静态图片和音频共同驱动生成的数字人动态视频了。以下是我亲测,使用EchoMimic 10倍加速版生成的数字人,效果非常强悍~
最强的是,我亲测了,真真正正的是10倍提速!原版生成1个数字人大概需要15~20分钟,现在直接5分钟以内,有图有真相️!
随着AI技术的不断推出,让我们能体验到越来越强的开源AI数字人,如果你对数字人技术充满好奇,如果你想亲手体验数字人带来的震撼效果,那么现在就是最好的时机。
让我们一起见证数字人技术的魅力和无限可能(一起将“危险”送到全世界去吧)!
为了让你能获得最佳的体验,有两点需要注意:
1. 显卡要求:建议使用配有至少8GB显存的英伟达显卡,以确保视频生成的流畅度和效果。
2. 中文字符问题:确保安装路径和上传的文件不包含中文字符,避免可能的兼容问题。
今天就聊到这了,我是Glen,感谢你看我的内容,欢迎大家继续支持我,请点赞、收藏、分享三连走一波吧~
关注我,私信回复【EchoMimic加速版】,免费获得本文资源~
我是Glen,原鹅厂、字节高级产品经理,现AI公司创始人。让一部分人,看见AI并连接。分享人工智能、互联网、商业、职场等内容,管理精力,提升认知。种一棵树最好的时机是十年前,其次是现在!