RTX 4080 SUPER是RTX 40 SUPER系列显卡中,定位最高的。相比于RTX 4080,RTX 4080 SUPER显卡使用完整规格的AD103核心,进一步提升规格,让它的AI算力也跟着拉升。同时“加量还降价”,性价比相当突出。
以Stable Diffusion为代表的AI绘图工具,正风靡全球。而显卡的算力又决定着Stable Diffusion的出图效率。相信很多小伙伴一定好奇到底最新发布的RTX 4080 SUPER显卡在Stable Diffusion中表现如何?
今天我们就以技嘉魔鹰RTX 4080 SUPER显卡为例,给大家送上实测!另外NVIDIA针对着Stable Diffusion专门推出了Tensor RT加速插件,使用Tensor RT加速对比默认模式,到底效率快多少呢?废话不多说,马上进入正题。
显卡规格:
RTX 4080 SUPER显卡相对RTX 4080,使用更完整的AD103核心,增加4个流处单元、512个CUDA核心、16个纹理单元。其加速频率提升45MHz,显存等效频率也提升到了23Gbps,显卡带宽达到736GB/s。
此外,RTX 4080 SUPER首发价仅为8099元,要知道RTX 4080首发价可是高达9499元,加量又降价,性价比暴涨。做工用料更扎实,供电与散热更豪华的技嘉魔鹰RTX 4080 SUPER显卡官方旗舰店售价也仅8799元,现在入手显卡的时机正合适。
这是一张怎样的显卡?
技嘉RTX 4080 SUPER魔鹰显卡的外观以黑色调为主,走沉稳风,没有太多花里胡哨的设计,属于那种耐看型的。
这张卡的长宽高为342 x 150 x 75mm,足足3.75槽的厚度,相当厚实。
其搭载技嘉“风之力”散热系统。正面三把110mm大风扇,支持RGB灯效,采用正逆转设计,提升风量;支持3D智能启停技术,在温度不高时候显卡风扇会自动停转,从而减少噪音以及延长使用寿命。
直触GPU的纯铜底座、9根复合式热管、进气格栅等,使显卡能够将GPU核心热量迅速传递出去,散热效能强大。
全尺寸的金属背板,大幅提升了显卡的结构强度。尾部镂空设计,有助于空气对流,更快散发热量。
RGB幻彩光轮,支持1680万色彩调节与多种灯光效果切换,可以通过技嘉智能管家进行自定义灯效设置。
采用了12VHPWR的供电接口,正常TGP功耗320W,峰值功耗可达到400W,推荐使用850W额定功率的电源。
提供了1个HDMI 2.1a和3个DP 1.4a接口,轻松满足高端用户多显示设备连接需求。
显卡提供了双BIOS切换开关,可以一键切换静音与性能模式。
接下来看看它的AI绘图实战表现:
测试平台:
CPU: Intel酷睿 i9-14900K主板:技嘉Z790 AORUS PRO X 冰雕X
显卡:技嘉RTX 4080 SUPER魔鹰显卡散热器: XPG 一体式水冷
电源:技嘉雪鹰850PG5W ATX 3.0
内存:技嘉DDR5-6000 16GBx2
SSD:影驰星曜X4 PRO 2TB PCIe 4.0
Stable Diffusion是目前最火的AI出图工具啦,文生图的强大功能,带来无穷的创意。而NVIDIA GPU则是运行它最高效、兼容性最好的装备。接下来,我们使用技嘉魔鹰RTX 4080 SUPER显卡来测试,看看它在Stable Diffusion出图效率如何?
Stable Diffusion Web UI设定上,采样方式为Euler a、采样步数为50、CFG Scale为7.5、每批次出图数为2、批次为10,最后统计每分钟出图数量。
可以看到,技嘉魔鹰RTX 4080 SUPER显卡的出图速度大约是RTX 4080显卡的105%,相对RTX 3080 Ti显卡,提升幅度达到42%左右。
技嘉魔鹰RTX 4080 SUPER显卡不仅批量出图的效率高,在出图之后,进行高清修复时,效率也是杠杠滴,可以帮助创作者快速完成出图工作,创作出自己满意的作品。
Tensor RT加速插件实测:
RTX 系列GPU还可以通过NVIDIA的TensorRT优化模型,进一步提升Stable Diffusion的出图速度。
我们在Stable Diffusion Web UI扩展栏,选择从网址安装,填写安装地址,点击安装,安装成功后重启即可。
安装成功之后,可以在SD Unet选择里看到TensorRT的加速引擎。
我们使用NVIDIA TensorRT分别对Stable Diffusion XL和Stable Diffusion V1.5的模型进行了优化,对比优化前后技嘉魔鹰RTX 4080 SUPER显卡出图效率的变化。Stable Diffusion V1.5的模型分别选用了512×512、768×768分辨率,而Stable Diffusion XL模型时选用1024×1024分辨率。其他参数方面,采样方式为Euler a、采样步数为50、CFG Scale为7、每批次出图数为1、批次为10。
从测试结果可以看到,使用TensorRT加速之后,技嘉魔鹰RTX 4080 SUPER显卡的提升非常明显,几乎都达到了3倍以上的增幅。且分辨率越高,出图越精细,模型越复杂,数量越多,TensorRT插件带来的增益就越明显。使用Stable Diffusion的N卡用户,TensorRT插件必须安排上。
总结:
专业AI绘画应用上,技嘉魔鹰RTX 4080 SUPER显卡凭借着256Bit、16GB高速显存,完整规格的AD103强大核心,提供高效的出图速度。并且NVIDIA GPU的黑科技--Tensor RT对Stable Diffusion进行加速优化,让选择技嘉魔鹰RTX 4080 SUPER显卡来完成AI出图任务的用户获得了巨大的效率提升。
当然,技嘉魔鹰RTX 4080 SUPER显卡拥有强悍的“风之力”散热系统、出色的用料与供电设计、极具吸引力的定价,确实称得上是AI绘图一大利器,推荐指数五颗星。