前言:
NVIDIA Ada 架构亮点解析熟悉NVIDIA显卡的玩家应该知道,在NVIDIA对显卡架构的命名都是以历史上赫赫有名的科学家为主,Fermi、Kepler、Maxwel 、Pascal、Ampere等。来到了RTX 40系列显卡,架构名以Ada Lovelace,该人来头不小:世界上第一份程序设计流程图就出自她手,被誉为第一位给计算机写程序的人,没想到世界第一个程序猿是女的。
Ada Lovelace架构的魅力如何?从架构上来说得益于台积电出品的定制型TSMC 4N制造工艺,核心晶体管数量相比上代Ampere架构的280亿个暴增到760亿个,看来科技是第一生产力诚不欺我。
Ada Lovelace AD102核心架构图
得益于台积电TSMC 4N工艺,专为GPU优化。造就了 Ada Lovelace核心架构规格相当凶猛:GPC数量从Ampere时代的5个增加到了12个。GPC里面的TPC与SM最高可达72个和144个,12个32-bit显存控制接口组成384bit位宽。
关于RTX 4070 Ti:
既然RTX 4080和RTX 4090是要征战4K和8K分辨率的,那么2K分辨率档位的主角又是谁?没错,就是今天所说的RTX 4070 Ti。
RTX 4070 Ti核心架构图RTX 4070 Ti采用AD104核心,都说皮衣男神刀法精湛,相比二哥RTX 4080,三弟RTX 4070 Ti的SM单元从76组减少至60组,CUDA Cores数量由9728个缩减到7680个,Tensor Cores与RT Cores数量也要刀一刀,L2缓存从65536KB降至49152KB。
晶体管数量从459亿个缩减到358亿个,只动GPU核心显然不够。显存方面也有动作,位宽从RTX 4080的256bit降至192bit,显存类型依旧保持是美光GDDR6X,但速率从22.4Gbps降到21Gbps。
既然显存速率和位宽都降了,显存带宽也肯定低了,从RTX 4080的716.8GB/s降至504GB/s。显存容量从16GB减少到12GB。不过“得益”于GPU核心规模的减少,即使GPU核心的动态加速频率比二哥RTX 4080还高,去到2160MHz,RTX 4070 Ti的整卡TGP只有285W,比二哥RTX 4080的320W要低不少。
GPC架构图
SM架构图
值得一提的是第三代RT Cores的有效光线追踪算力达到 191 TFLOPS,是上一代产品3倍。第四代 Tensor Core新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,相比上一 代提升幅度高达5倍,使得显卡的深度学习性能大幅提升,除了生产力提升还能助力新一代DLSS3.0。
什么是DLSS3.0
DLSS2.0大家都很熟悉了,默认状态下在2K~4K分辨率下开启光线追踪画质,巨大的预算量对显卡来实在不堪重负。此时DLSS2.0能通过将游戏画面降低到1080P分辨率进行渲染,大大降低了GPU的负担。渲染完成后通过Tensor Core进行AI进行学习计算补全1080P与4K的像素差距最终输出4K画面,从而提升游戏帧率。
如果说DLSS2.0只是通过AI计算当前一帧的画面,那么DLSS3.0则是更进一步。
得益于RTX 40系列显卡独有的第四代Tensor Core与更多的光流加速器,使得DLSS 3.0的AI算力得以大幅提升,计算分析帧与帧之间的缺失的画面。相比DLSS 2.0,说个不太恰当的比喻,DLSS3.0就是通过AI算法将拟补的像素画面算得更多更细了。这,就是NVIDIA所说的全新帧生成技术。
官方宣称DLSS 3.0能带来2到4倍的游戏帧率提升。NVIDIA加入了着色器执行重排序(SER)提高光追并行效率,能为显卡的光线追踪带来最高3倍的性能提升,整体游戏性能表现提升高达25%。
既然画质与帧率都得到了保证,那么画面输出延迟又如何解决?NVIDIA Reflex技术很好的解决了这一痛点。
由此可见DLSS 3.0带有三大亮点:全新的帧生成、不断改进的DLSS 2.0、NVIDIA Reflex,以上三者让光线追踪游戏从以往的部分场景进化为全场景光线追踪!从上图可知,要完整享受到DLSS 3.0的魅力,RTX 40系列显卡必不可少。令人惊喜的是更老的Geforce900或以后显卡也能享受到NVIDIA Reflex性能福利。
支持DLSS3.0的游戏多吗?
截止至发文前,支持DLSS3游戏已经有35款+之多,其中15款已经上市,从上图能看到不少耳熟能详的游戏大作(赛博朋克2077、仙剑奇侠传7、光明记忆:无限)等都已经在列。后续还在不断的增加当中。
生产力的提升:
Ada Lovelace架构相比Ampere架构的另一项重要升级就是NVIDIA 编码器 (NVENC)升级到了第八代,开始支持AV1编码了。
AV1的效率比H.264高40%,在传输同样质量的画面时候只需要大约70%的数据量,或者说在同样的带宽下可以实现更清晰的画面质量,相比现在常用的H.264,AV1编码能在保持画质基本一致的前提下,能节省了多达30%的码率,有着不小的带宽优势,而且还是免费使用。啊鲁猜测未来AV1将成为视频编码主力。
产品开箱:
啊鲁这次拿到手的是七彩虹的iGame GeForce RTX 4070 Ti Ultra W OC显卡。12GB GDDR6X显存,DLSS3.0、实时光线追踪、REFLEX、STUDIO特性一个都不少。
看到iGame RTX 4070 Ti Ultra W OC的第一眼,啊鲁就被惊艳住了,显卡外观颜色会随着光线、角度、色温、强弱的不同而发生变化。
这让啊鲁想起无双电影中那个"我来搞定变色油墨”的梗,哈哈。
显卡正面采用三段分割处理,渐彩多色渐变,让整块显卡充满时尚与活力。同一个位置,从不同角度看就有不同的颜色,这多彩的外观不比其他那些只会玩RGB光污染、不通电时就黑乎乎的产品强多了?
显卡配备三枚10cm风扇采用九翼环形扇叶,为显卡散热器带来更强的风压与气流。
外观细节也做得可圈可点,给人一种精致感。
若隐若现的 iGame LOGO
点状纹理
银色的iGame LOGO铭牌位于显卡右下方,低调简约。GEFORCE RTX信仰标识。显卡侧面的LED灯加入了镜面处理,ULTRA与充满动漫画风的纹理有种二次元的气息。显卡侧方的细节感也满满,ULTRA的字体让啊鲁想起赛博朋克2077!
显卡供电接口方面继续采用12V HPWR规格。
还在使用上一代规格电源的用户也不用担心,配件中带了一根12VHPWR供电转接线。顺带提一嘴RTX 4070 Ti推荐电源功率为700W。
再来看显卡背面,白色金属背板与白色波普外甲遥相呼应,粉红色标识IGAME独有的三角元素巧妙的融合一齐。圆点纹理也起到画龙点睛的作用。iGame RTX 4070 Ti Ultra W OC,实在是只因你太美!比PCB更长的散热模块有利于风扇将热量吹离显卡本体。
I/O输出接口带iGame家的一键超频快捷键,而接口配置方面3*DP1.4a+1*HDMI2.1。上机走起!细心的读者可能已经发现显卡波普外甲的颜色此时又变了粉红色!惊喜不惊喜,意外不意外?
上机走起!
这点状LED灯光模块也是浓浓的波普风。
测试平台简介:
测试平台为i9 13900K+Z790+DDR5 6000MHz+额定1000W电源。为了看看RTX 4070 Ti有多厉害,特意加入上代旗舰RTX 3090 Ti进行对比。
GPU-Z 2.5.2已经完全识别出RTX 4070 Ti的硬件规格,从图中能看到iGame RTX 4070 Ti Ultra W OC的Boost频率要比公版的2610MHz更高,达到了2745MHz,性能自然更强。所用的显卡驱动为527.62,操作系统为Windows 11 22H2.
3D理论性能测试:
先来看3D理论性能测试,从分数上看,不得不说RTX 4070 Ti向上代旗舰大哥RTX 3090 Ti看齐哇,1080P与2K的得分斗得难分难解,RTX 4070 Ti在4K分辨率与光追测试中稍稍落后但不多。毕竟两者的显存容量相差一倍且显4070 Ti的显存位宽也低一些。
光追游戏性能测试:
游戏分辨率为2K 游戏画质:全高
RTX显卡当然首先要看光追游戏性能,这也是众多玩家选择N卡的重要原因。从上图能看到RTX 4070 Ti的游戏表现并没有被上代旗舰RTX 3090 Ti拉开十分明显的距离,尤其在对硬件性能要求比较高的赛博朋克2077与看门狗军团游戏中两卡的游戏体验可以说一模一样。有些游戏还实现追平甚至超越!
DLSS3.0与2.0大对决:
须知道DLSS是NVIDIA RTX显卡的独门秘笈,随着显卡来到了RTX40时代,DLSS也发展到3.0,与RTX30系列的2.0相比无论是画质还是性能都提升不少,在2K分辨率下RTX 4070 Ti光追游戏帧率凭借DLSS3.0成功反杀只有DLSS 2.0的RTX 3090 Ti。如果说RTX 3090 Ti的游戏体验是较为流畅的话,那么RTX 4070 Ti的游戏体验则是绝对流畅!
DLSS3.0的威力:
在3DM DLSS测试中,开启DLSS3.0后RTX 4070 Ti的帧率提升幅度高达100%!
如果说跑分都是浮云的话,实际游戏测试走起,从上图成绩来看,光线追踪游戏在开启DLSS 3.0后游戏帧率与没有DLSS相比均有翻倍的提升。要知道这时候啊鲁开的DLSS 3档位是质量模式,如果选择性能或者均衡模式,DLSS 3的领先幅度会更多!
光栅化游戏测试:
在传统光栅化为主的游戏中,RTX4070 Ti与老大哥RTX 3090 Ti相比更是稍占上风。
生产力测试:
随着NVIDIA 编码器 NVENC升级到第八代,RTX 40系列显卡已经支持AV1编解码,目前剪映专业版支持AV1编码导出。
RTX 4070 Ti完成导出时间
RTX 3090 Ti完成导出时间
可以看到由于RTX 3090 Ti不支持AV1编码,因此全靠i9 13900K CPU来干活。
用RTX 4070 Ti导出一个AV1的789Mbps码率的视频,在其他硬件保持一致的前提下,只RTX 4070 Ti需要98秒即可完成视频渲染导出,相比RTX 3090 Ti节约了将近7分钟的时间。
4K MOV原视频截图
4K AV1编码视频截图
4K H.264编码视频截图
从上面三个对比画质图片可见,AV1编码相比H.264编码的视频在画质上并没有肉眼可发现的损耗,用更低的码率做到近乎一样的画质,这无论对视频创作者还是视频网站用户来说都是喜闻乐见的。
除了视频剪辑,VRay渲染器也是N卡为生产力加速的目标之一。RTX 4070 Ti渲染得分RTX 3090 Ti渲染得分
在Vray GPU RTX渲染测试中,RTX 4070 Ti做到了跟RTX 3090 Ti平起平坐。
温度与功耗:
在Furmark时长5分钟的显卡满载烤机中,iGame RTX 4070 Ti Ultra W OC的核心最高Boost频率去到2820MHz,这比原厂标定的2745MHz还要高,板载最高功耗291W。
GPU温度为61℃,看来显卡内置的6根6mm热管+3*10CM风扇的散热能力还是可圈可点的。那么实际游戏的功耗又是如何呢?下面用几个比较新的游戏来看看。
瘟疫传说:安魂曲游戏功耗243W,GPU频率去到2805MHz。地平线5也才184W,GPU频率2820MHz,显卡功耗才184W,显然这游戏有点弱。
再来看赛博朋克2077,GPU频率2805MHz,显卡功耗才230W。
可见,在日常游戏中,RTX 4070 Ti的功耗一般都在250W以内,在游戏的过程中基本没看到功耗能去到Furmakr烤机满载那么高。
显卡烤机的噪音如何?即使是裸机状态下,显卡5cm处测得的风扇噪音也不超过50分贝,装进机箱后几乎是细不可闻了。
全白色主题的主机,衬托出iGame RTX 4070 Ti Ultra W OC的颜值!
机箱用的是华硕GT502弹药库,如果最近你打算组建白色桌搭的话,我这套组合颜值还是不错滴。
机箱顶部带两根魔术贴手提带,搬运机箱更为方便,同时让机箱也更具个性。
2*USB 3.2 Gen1速率的TYPE-A接口、3.5mm二合一的音频接口USB 3.2 Gen2速率的TYPE-C接口各一个。机箱背面分区明确,硬盘区域、冷排/风扇区域、电源区域都有防尘散热开孔设计。
后方架子可以装360mm冷排。电源仓与主板仓采用双层设计。后置一枚12cm风扇安装位。
总结:
如果说RTX 4080和RTX 4090让你感到价格触不可及的话,我相信iGame GeForce RTX 4070 Ti Ultra W OC相对亲民的价格会让你更为心动。
在2K分辨率下,iGame GeForce RTX 4070 Ti Ultra W OC游戏性能可与上代旗舰RTX 3090 Ti扳手腕,而且在2K分辨率、DLSS3的加持下,光追游戏性能更是超越上代旗舰,而且RTX4070Ti性能不俗的同时功耗比RTX3090Ti还要低不少。可见Ada Lovelace架构的威力还是很猛的!如果你是2K分辨率的游戏用户,这卡真的值得考虑!
另外使用的原材料少了,为啥价格反而高了?
2k/4k都被3090暴打
如果不考虑DLSS3。两张显卡的差距是多少?毕竟大家也知道DLSS3,支持的游戏并不多。
显存砍废了[汗]