nvidia rtx 40 super系列目前已经发布了三款产品,其中最特别的当属rtx 4070 ti super,这也是nvidia首次采用ti和super的双重后缀,今天就为大家带来技嘉geforce rtx 4070 ti super aero oc 16g这款显卡的评测。
本次的super作为升级系列,性能相较原型卡有较大提升,但令人意外的是其中70 super和70 ti super价格维持不变,而80 super更是直降1400元。所以不出意外的话,这三张super显卡今后会成为中高端市场的主要售卖产品,而原型卡不管是出于市场规律,还是销售策略,应当都会有相应的价格调整。
性能方面,虽然这张rtx 4070 ti super属于70级别,但其实力不容小觑,在2k分辨率下能够达到光追游戏百帧的体验,甚至传统3a游戏中4k分辨率下也能够达到流畅效果,具体成绩可直接查看下面的测试成绩。下面先来看看技嘉geforce rtx 4070 ti super aero oc 16g整体外观。
1 技嘉geforce rtx 4070 ti super aero oc 16g 概览
技嘉geforce rtx 4070 ti super aero oc 16g为技嘉雪鹰系列(以下简称 技嘉rtx 4070 ti super 雪鹰),卡身通体纯白。所以在包装方面技嘉也做出了较大改变。
技嘉rtx 4070 ti super 雪鹰的包装除了象征n卡的绿色外,整体采用纯黑白配色,aero的系列标志位于版面的最左侧,由于大面积的留白,设计感极强,甚至有一种电影海报的感觉。
技嘉rtx 4070 ti super 雪鹰整卡的尺寸为300×130×53mm(不含挡板),占用2.5槽空间。尺寸在同级别产品中稍小。
这张显卡的导流罩采用两种材质堆砌而成,在风扇区域覆以拉丝工艺的金属装甲。虽然两种材质截然不同,但无论从色系还是质感,却更显相得益彰。
散热方面,技嘉rtx 4070 ti super 雪鹰整体采用风之力散热系统,三个90mm的大直径风扇作为主动散热,采用正逆转设计,并支持智能启停,当gpu温度较低或处于较低负载时,风扇将会自动停止运转,提供零噪音的使用体验。每个风扇上还可以看到3d条纹线,它可以有效引导气体由风扇边缘分流,送风均匀稳定。
除此之外,技嘉rtx 4070 ti super 雪鹰的散热风扇采用了纳米石墨烯润滑油,可延长油封轴承风扇寿命,达到如滚珠轴承一样的使用寿命,且更为安静。
再来看一下背板,技嘉rtx 4070 ti super 雪鹰采用一体式金属背板,从右侧镂空的进气格栅能看到大量散热鳍片以及热管,依此也可以判断出,这张显卡同样采用了较短的pcb板。内部散热上,则采用铜板直接接触gpu,搭配8根复合式热管,提供更高的导热效率。
技嘉rtx 4070 ti super 雪鹰的侧面,拥有整卡唯一一处灯光设计,在上机后aero的logo默认为白色灯光,也可通过技嘉智能管家(gcc)调节其他灯光效果。而logo边缘的炫彩贴片,也颇有一种雪具装备反射日光的感觉。
视频输出接口上,技嘉rtx 4070 ti super 雪鹰依旧采用了hdmi 2.1 dp 1.4a*3的四接口设计。hdmi 2.1可支持4k 120hz hdr、8k 60hz hdr。
本次技嘉rtx 4070 ti super 雪鹰整卡功耗为285w,采用单16pin的辅助供电,建议电源为750w及以上,边上的拨杆可切换不同bios模式。
2 nvidia geforce rtx 4070 ti super 架构浅析
本次发布的geforce rtx 40系显卡由全新的nvidia ada lovelace架构打造,采用tsmc 4n nvidia定制工艺,旗舰核心ad102达到了的760亿个晶体管,而在rtx 30系显卡中为280亿个。
与上一代nvidia ampere相比,nvidia ada lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-tflops的着色器数据吞吐量。
本次发布的rtx 4070 ti super共有8448个cuda核心,提供了44-tflops算力;66个第三代ada rt core拥有102 rt-tflops;264个第四代tensor core可提供706 tensor-tflops(ai tops)。
rtx 4070 ti super的l2 cache容量为48mb,带宽为672 gb/s。nvidia官方也特别表明了l2 cache的重要性,我们以两张图来简单说明l2缓存的作用。
在真正的gpu中,内核是所有计算发生的地方,而这就是l1数据缓存的作用所在。每个sm都有一个超低延迟的l1数据缓存,紧挨其处理内核,使l1成为gpu寻找信息的首选。然而由于l1缓存需要离内核非常近,不可能非常大。
如果在l1缓存中找不到内核计算所需的数据,gpu将在l2数据缓存中寻找。这个显存系统位于gpu芯片上,并通过一个非常高速的横梁系统连接到所有的gpc(图形处理集群),每个gpc包括多个sm。如果在l2缓存中找到了信息,那么gpu就挑出这些数据并将其放入内核。
如果在l2缓存中找不到信息(被称为缓存缺失),那么gpu将通过显存接口在vram中寻找。这在整个gpu存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张rtx 4070 ti super更接近于rtx 4070 ti,距离rtx 4080还有一定差距,不过相比rtx 4070 ti提升多少,还要看我们后面实测的结果。
另外最主要的价格方面,这张rtx 4070 ti super与rtx 4070 ti相同,都是6499元。依然是加量不加价,下面我们直接看测试成绩。
3 测试平台简介
首先介绍一下测试平台,为了保障技嘉rtx 4070 ti super 雪鹰的性能发挥,我们的平台采用了最新的i9-14900k。
主板我们搭配了技嘉z790 冰雕x主板,这次采用了纯白外观设计,所以十分适合打造目前流行的白色主机,这次技嘉连pcb板都涂装成了白色,可谓是诚意满满。
在供电方面,为了能让高端酷睿处理器性能充分发挥,技嘉为z790 冰雕x主板配备了18 1 2相供电模组,单相输出90a,足够让大部分14代酷睿超频使用,发挥出全部性能,就算是旗舰酷睿i9-14900k来了,也能轻松搞定。
下面还是来看看本次评测的显卡参数,目前最新的gpu-z为2.57版本,参数识别较为详细。
技嘉rtx 4070 ti super 雪鹰拥有8448个cuda,boost频率为2655mhz,有小幅提升。虽然此次没有公版显卡,但nvidia给出的官方boost频率为2610mhz。
显卡采用16gb gddr6x显存,位宽为256bit,这里值得注意的是,虽然rtx 4070 ti super整体规格更贴近rtx 4070 ti,但位宽与rtx 4080相同,所以整体的带宽也要更高。光栅单元和纹理单元为96和264。
4 理论性能测试
本次测试的技嘉rtx 4070 ti super 雪鹰主要对比它的上下型号,rtx 4080以及rtx 4070 ti。
下面先进行的是用来衡量显卡dx11理论性能的3dmarkfs套装:fs,fse,fsu三者分别对应显卡在1080p、2k、4k的理论性能,取显卡分数实际测试结果如下:
在fs测试中,技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti,其中fs提升13%;fse提升12%;fus提升12%,综合提升13%。对比rtx 4080,综合成绩相差12%左右。
而在针对dx12环境下的time spy和time spy extreme测试中,技嘉rtx 4070 ti super 雪鹰相较rtx 4070 ti的提升分别为:ts提升12%;tse提升13%,综合约为13%。对比rtx 4080,综合成绩相差13%左右。
portroyal是3dmark中专门针对光追性能的测试项,技嘉rtx 4070 ti super 雪鹰相较rtx 4070 ti的提升约为17%。对比rtx 4080,相差11%左右。
下面我们再来看看3dmark中新增的一些具体应用场景的测试。
speed way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以sw的测试基本可以看做次世代3a游戏基准。
技嘉rtx 4070 ti super 雪鹰对比rtx 4070 ti,从1080p分辨率到4k提升依次为:24%/24%/27%。由于rtx 4070 ti并不适合8k分辨率下运行,所以8k成绩仅供参考。
最后是dlss 3的相关性能测试。这一项测试更偏向实际的游戏帧数跑分,所以整体基数较小,技嘉rtx 4070 ti super 雪鹰的综合提升依然在15-20%左右。
从整体的理论测试成绩来看,传统的fs/ts/pr三项测试,技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti综合提升约为14%左右;相比rtx 4080的差距在13%左右,而最新的sw综合测试也基本呈现相同的结果。
5 常规游戏 性能测试
由于本次rtx 40系加入了dlss 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3a大作进行游戏性能对比。
首先我们测试了近期非常热门的《幻兽帕鲁》,这款游戏自带dlss,所以n卡要更轻松一些。另外游戏虽然采用了虚幻引擎制作,但目前ea阶段游戏内容整体还是比较糙的,所以对于显卡的要求并没有很高。
我们选择最高画质进行帧数实测,技嘉rtx 4070 ti super 雪鹰即便在4k分辨率下都能达到百帧以上较高的帧率,不过此类模拟建造类游戏,会随着世界内容的增多逐渐变卡,所以以上测试成绩仅供参考。
《幻兽帕鲁》游戏共有5个画质档位,其中最高和最低差距较大,主要区别在于光线渲染、抗锯齿和植被,在材质和贴图方面差别较小。
接下来便是一些老朋友,在《极限竞速:地平线5》中,其中技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti提升较为明显,从1080p到4k分辨率分别提升11%/11%/15%。
在《刺客信条:幻景》中,技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti的提升分别为:1080p提升10%;2k提升14%;4k提升15%,综合提升13%。
在《无主之地3》中,技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti的提升分别为:1080p提升16%;2k提升20%;4k分辨率提升19%,综合提升18%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“rtx最高/dlss质量”。
性能方面,技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti的提升分别为:1080p提升14%;2k提升14%;4k提升17%,综合提升15%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“rtx最高/dlss质量”下进行。
在《边境》中,技嘉rtx 4070 ti super 雪鹰相比rtx 4070 ti的提升分别为:1080p提升13%;2k提升15%;4k提升15%,综合提升14%。
在“游戏测试标杆”的《赛博朋克2077》中,由于增加了最新的光追超速模式,成绩比较多,我们分别对比不同模式下的帧数。
可以看到在4k分辨率下技嘉rtx 4070 ti super 雪鹰即便是超级画质模式,也仅能达到60帧的流畅水准,但光追超级模式与之相差的并不多。
而在2k分辨率下光追超级模式也能达到接近百帧的流畅水准。作为一款以光影效果见长的次世代游戏来说,着实难得。
不过该测试中并未开启dlss 3,后面将有更详细的dlss 3对比测试。
超级画质光追超级超速模式从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
另外《赛博朋克2077》更新了dlss 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启rtx能够看出画质明显的区别,不再赘述。重点在于dlss 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。
6 dlss 3性能测试
截止目前,超过500款游戏和应用已支持 rtx 技术。
其中《龙之信条 2》、《灰区战争》、《半条命 2》rtx 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《pax dei》、《星际矿工》和《王权与自由》均将支持 dlss 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 dlss 3 的支持,为配备 geforce rtx 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。
本次dlss 3增加了1% low fps和延迟的测试,1% low fps则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。
本次我们分别对《赛博朋克2077》,在三档画质下进行了dlss 3的帧数测试,所有档位均开启dlss质量记录帧数。
可以看到在2k分辨率下,即便是光追超速模式,开启dlss 3后依然能达到88帧的成绩,完全达到高帧率的流畅标准。
另外dlss 3技术主要针对于cpu瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中光追超速的1080p分辨率能够达到55%左右。
《星空》在1.8.86大版本更新后,加入了dlss 3,整体来看效果非常好,即便在4k分辨率下也能够达到112帧的流畅水准。
其中1080p分辨率下dlss 3相比dlss 2提升达到53%;2k分辨率提升51%;4k分辨率提升41%。
《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在技嘉rtx 4070 ti super 雪鹰也有较明显的体现。在3种分辨率中,开启dlss 3相比dlss 2的提升分别为40%/29%/11%。
最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升。
其中技嘉rtx 4070 ti super 雪鹰在2k分辨率下,开启dlss 3相比关闭dlss,提升达到了106%;相比dlss 2的提升也达到了53%。另外在开启dlss 3后会强制开启reflex boost,能够大幅减少画面延迟。
7 生产力工具测试
v-ray
在生产力工具上,我们测试了最新版本的v-ray渲染器,选择使用gpu渲染的cuda测试和rtx测试,成绩如图。
d5渲染器
d5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括sketchup、3ds max、rhino、revit、archicad、blender、c4d等。目前也已经支持dlss 3,下面我们分别看看帧数和功耗的情况。
选择软件自带的默认场景【简约客厅】
在实时帧数表现上,由于d5采用实时gpu渲染,所以压力全在显卡。可以看到在4k分辨率下,技嘉rtx 4070 ti super 雪鹰也是ppt的状态,仅有18帧。而开启dlss 3后,帧数提升可达到261%左右,非常暴力。
功耗方面,技嘉rtx 4070 ti super 雪鹰的tdp为285w。关闭dlss的情况下,实际平均使用功耗为248w,而在开启dlss 3后,功耗仅有219w。更低的功耗,更高的帧数,dlss 3对于内容创作者来说,也是更必要的技术加持。
8 on1 resize ai 2023测试
本次测试新增了on1 resize ai 2023的测试,它是一款ai图像修复软件,包括图片缩放,内容填充等功能,同时它也可以作为ps等软件的插件形式存在,非常方便快捷。
测试选择nvidia提供的5张高分辨率图片进行,我们将在原图片的尺寸上直接放大200%,可以看到放大后的图片尺寸已经达到了12000×8000。
由于该软件仅有文本日志记录时间,为了方便观看,我们进行了表格整理。使用技嘉rtx 4070 ti super 雪鹰进行ai计算后,5张图片最终用时37734ms,即37秒左右。
放大后使用nvidia icat进行对比,左侧为使用on1 resize ai 2023进行放大200%的图片,可以看到在车胎部分的编码明显比原始图像更清晰。
ai对于日常生活的应用的确更加方便,在我们以往的认知中,图片尺寸放大必然会损失质量。但经由ai的加持,反而更清晰,这对于老照片的修复,起到了更加便捷的作用。
9 rtx 视频超分辨率(rtx video super resolution)测试
目前rtx 视频超分辨率(rtx video super resolution)已经在部分浏览器中进行测试,首先玩家需要更新到nvidia最新驱动,在nvidia控制面板中的【调整视频图像设置】可以看到最新的rtx 视频增强超分辨率。
rtx 视频超分辨率是 ai 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启rtx 视频超分辨率不仅需要最新版驱动,还需要使用rtx 40或30系列gpu,并且几乎适用于google chrome和microsoft edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开youtube或者b站,都可以享受到rtx vsr效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到gpu负载增加,即为开启成功。
我们打开youtube随意观看视频,在打开rtx vsr后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
(点击放大查看原图)
在下面这幅图的对比中,可以明显看到开启rtx 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。
不过需要注意的是,rtx 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2k以上,则基本很难看出区别。
这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。
10 温度及功耗测试
功耗测试中,我们选择furmark软件进行拷机测试,并采用gpu-z检测温度,功耗仅计算显卡自身。
可以看到技嘉rtx 4070 ti super 雪鹰这张显卡通过40分钟左右的拷机测试,温度在63℃左右,热点温度在74℃左右,显存温度58℃左右。
游戏动态功耗测试
本次我们在拷机测试中最大板载功耗为285w左右。不过由于不同游戏负载不同,gpu的实际功耗是动态变化的,类似于fps随时间的变化,rtx 40系列很难触及功耗墙。
技嘉rtx 4070 ti super 雪鹰 3a游戏平均功耗
在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、dlss质量、2k分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。
可以看到技嘉rtx 4070 ti super 雪鹰平均功耗为274w,在实机测试中,基本达不到峰值功耗。
11 3a游戏 4k无压力
作为一张加量不加价的super系显卡,rtx 4070 ti super无疑是非常具有性价比的一款产品。虽然在传统的理论测试中(fs/ts/pr)。它的成绩更接近于rtx 4070 ti,但在更加次时代场景化的sw测试中,明显可以看到它更接近rtx 4080。
而从大部分游戏实测来看,它的成绩的确与rtx 4080差距很小。可以说super显卡的发布,让rtx 40 系整个70级产品性能有大幅提升。这张技嘉rtx 4070 ti super 雪鹰不仅局限于2k高帧,在4k分辨率下同样有着不错的表现。
在传统3a游戏中,它的4k分辨率达到百帧基本不成问题,优化好一点的如《极限竞速:地平线5》,更能达到电竞级帧率。
在光追游戏中,4k分辨率下也能达到流畅效果。可以说这张rtx 4070 ti super已然有了80级别的水准。
而内容创作和ai方面,这张rtx 4070 ti super拥有16gb大显存,搭配媲美80级显卡的算力,可以胜任任何轻度创作。
外观方面,本次评测的这张技嘉rtx 4070 ti super 雪鹰采用了双重材质拼接的设计,以雪白色和金属银为基调,虽然两种材质截然不同,但无论从色系还是质感,却更显相得益彰,甚至隐隐显现出一些运动基因。
雪鹰系列的定位与魔鹰基本相同,但一款更偏电竞风格,一款则是纯白设计,搭配目前流行的白色全家桶,适配性非常强。
目前技嘉rtx 4070 ti super 雪鹰在旗舰店有售卖,而且目前还有百元e卡的返现活动,有兴趣的不妨前去了解。
评论