rtx 40的super系列终于发布,本次ces大会上,nvidia一共公布了三款新品,并且按照解禁的先后顺序为rtx 4070 super、rtx 4070 ti super以及rtx 4080 super三款显卡。今天为大家带来的是来自七彩虹的igame geforce rtx 4070 super ultra w oc 1的评测。
rtx 4070 super相比rtx 4070只贵了100元。从价格来看,这次的super系列整体都秉承着加量不加价的理念,甚至rtx 4080 super更是“加量降价”!
而rtx 40 super系列的发布,也让人想到了最近一代rtx 20 super系显卡,同样是性价比卓群,下面先来看看本次评测的igame geforce rtx 4070 super ultra w oc显卡外观。
目前,igame geforce rtx 4070 super ultra w oc 12gb已在七彩虹米乐体育官方下载官网商城及京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道同步开售。
除了本次评测款,七彩虹还同时准备了igame vulcan、neptune、advanced及战斧、colorfire meow等多个不同系列的geforce rtx 4070 super显卡供玩家选购,售价4899元起。
1 igame geforce rtx 4070 super ultra w oc概览
本次igame geforce rtx 4070 super ultra w oc 12gb显卡的外包装依旧采用了ultra系列独有的设计风格,其中大量的波点元素,在不同光线下,会有不同的反射效果,并且整体风格相较其他系列产品,更加轻快活泼。
igame geforce rtx 4070 super ultra w oc 12gb显卡的整体尺寸约为313.5×118.8×50.5mm(不含挡板),占用2.5槽空间。从正面也就是无光反射的情况下看起来,这张显卡的确平平无奇,但无果在光线下又是另一番景象。
从稍侧的角度,能够看到外甲经过光线反射后的“igame”暗纹,以及独特的波点元素。所以,波普风到底是什么样的艺术表现形式?它和此前rtx 30 ultra显卡的蒸汽波又有什么不同?
波普风强调明亮的颜色和平面化的形态为特征,运用大量的图案化和印刷品的元素,强调视觉效果和有趣的创意。
波普艺术希望通过大胆、直观的创作来打破封锁的过去。例如宣传广告、漫画、电视节目等等,表现出轻松、愉快和充满活力的气氛。
如果大家一时依然难以分辨,只需要记住,当你看到雕像、椰树、失真以及蓝紫色的天空等元素时,它大概率是蒸汽波风格,而如上图鲜明的色块拼接、平面化、夸张等元素时,那么它大概率就是波普风。
并且波普风通常具有较强的视觉冲击力,是经久不衰,也是年轻人喜爱的一种艺术表现。
从以上的描述中,我们也能很好地分别出igame rtx 40 ultra系列的波普风格,其运用了大量明快、简洁的设计语言,并且辅以分层、波点、镭射等元素,让人非常能感受到充满活力的气氛,更加适合年轻潮玩的特点。
在产品本身,igame geforce rtx 4070 super ultra w oc 12gb显卡采用三个11叶90mm风扇,外环相连。双滚珠轴承保障风扇转动过程中柔滑顺畅,延长寿命,降低噪音。
显卡背面采用了同样波谱设计的背板,贯穿且突破边界的ultra字样,大胆、直观的突显了年轻人不羁的性格。在显卡尾部的镂空部位,隐藏了igame logo,细节满满。
另外相比此前的rtx 4070 ultra,这张rtx 4070 super ultra取消了背部核心的镂空散热部分,也让背板一体性更强,更加凸显波普设计风格。
视频输出接口上,依旧采用了hdmi 2.1 dp 1.4a*3的四接口设计。hdmi 2.1可支持4k 120hz hdr、8k 60hz hdr。
igame祖传的一键超频按钮在这张显卡上同样存在,igame geforce rtx 4070 super ultra w oc 12gb默认为2475mhz;按下后将超频至2565mhz。
igame geforce rtx 4070 super ultra w oc 12gb显卡侧面可以看到16pin供电接口,它的tdp功耗为220w,建议电源650w及以上。不过16pin接口可支持单路600w输出,这接口着实有点浪费。
2 nvidia geforce rtx 4070 super 架构浅析
本次发布的geforce rtx 40系显卡由全新的nvidia ada lovelace架构打造,采用tsmc 4n nvidia定制工艺,旗舰核心ad102达到了的760亿个晶体管,而在rtx 30系显卡中为280亿个。
与上一代nvidia ampere相比,nvidia ada lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-tflops的着色器数据吞吐量。
本次发布的rtx 4070 super共有7168个cuda核心,提供了35.5-tflops算力;56个第三代ada rt core拥有82.1 rt-tflops;224个第四代tensor core可提供568 tensor-tflops(ai tops)。
rtx 4070 super的l2 cache容量为48mb,带宽为504 gb/s。nvidia官方也特别表明了l2 cache的重要性,我们以两张图来简单说明l2缓存的作用。
在真正的gpu中,内核是所有计算发生的地方,而这就是l1数据缓存的作用所在。每个sm都有一个超低延迟的l1数据缓存,紧挨其处理内核,使l1成为gpu寻找信息的首选。然而由于l1缓存需要离内核非常近,不可能非常大。
如果在l1缓存中找不到内核计算所需的数据,gpu将在l2数据缓存中寻找。这个显存系统位于gpu芯片上,并通过一个非常高速的横梁系统连接到所有的gpc(图形处理集群),每个gpc包括多个sm。如果在l2缓存中找到了信息,那么gpu就挑出这些数据并将其放入内核。
如果在l2缓存中找不到信息(被称为缓存缺失),那么gpu将通过显存接口在vram中寻找。这在整个gpu存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张rtx 4070 super更接近于rtx 4070 ti,但功耗相比rtx 4070只提升了20w。
另外最主要的价格方面,相比rtx 4070的建议售价只贵了100元,下面我们直接看测试成绩。
3 测试平台简介
首先介绍一下测试平台,为了保障igame geforce rtx 4070 super ultra w oc的性能发挥,我们的平台也进行了全面更新,采用了igame ultra family全家桶。
本次装机的机箱为igame c23a ultra w,它也是这次igame ultra family最重要的成员。机箱正面面板设计有大尺寸igame主题的“深渊镜”特效灯板。灯板下方为带有装饰性的镂空斜纹,同时它也兼具着进风散热的作用,集装饰性和美观于一体。
主板侧边设计有大尺寸igame主题的“点阵式”特效灯板,同时在顶盖、电源仓侧边、理线仓位置,都有igame ultra系列的主题丝印,搭配ultra系列家族其他成员后,能将“波普风”的设计语言延伸至整个机箱内部,不再局限于单独的配件,形成更具主体性的视觉冲击效果。
igame lq360 ultra w的一体式水冷同样采用了ultra家族产品线专属的设计风格,冷头部分“深渊镜”argb灯效为igame logo,与机箱正面遥相呼应;侧边有额外同步灯圈设计。
igame lq360 ultra w水冷散热器整体均由白色主体与多处波普风格铭板组成,冷排与散热风扇同样带有ultra产品线专属的家族装饰。
igame 16g*2 6800 ultra w内存也是来自ultra家族的新品,以简约、精致的设计风格为主,整体风格彰显优雅。主色调上统一使用了ultra系列的纯白色主色。
ultra家族丝印设计在内存导光条处。当内存运行时,丝印工艺能够与rgb灯光互相折射,产生出发散式的幻色光。另外在内存不发光的情况下,ultra家族丝印仍然能够根据光线实现颜色变化。
如果说igame ultra显卡是该家族波普风的主视觉,那么搭配机箱、主板、内存、散热器、电源等这些周边配件,才能够形成一套完整的波普风立体视觉海报。
下面还是来看看本次评测的显卡参数,目前最新的gpu-z为2.56版本,能够识别到显卡的一些基础规格,但芯片本身还没识别到。
igame geforce rtx 4070 super ultra w oc拥有7168个cuda,boost频率为2565mhz,与rtx 4070相同,但基础频率稍高。
采用12gb gddr6x显存,位宽为192bit,显存带宽504 gb/s,光栅单元和纹理单元为80和224。
4 理论性能测试
本次测试igame geforce rtx 4070 super ultra w oc主要对比它的上下型号,rtx 4070 ti以及rtx 4070。
下面先进行的是用来衡量显卡dx11理论性能的3dmarkfs套装:fs,fse,fsu三者分别对应显卡在1080p、2k、4k的理论性能,取显卡分数实际测试结果如下:
在fs测试中,igame geforce rtx 4070 super ultra w oc相比rtx 4070,其中fs提升17%;fse提升17%;fus提升23%,综合提升19%。对比rtx 4070 ti,综合成绩相差5%左右。
而在针对dx12环境下的time spy和time spy extreme测试中,igame geforce rtx 4070 super ultra w oc相较rtx 4070的提升分别为:ts提升16%;tse提升17%,综合约为17%。对比rtx 4070 ti,综合成绩相差6%左右。
portroyal是3dmark中专门针对光追性能的测试项,igame geforce rtx 4070 super ultra w oc相较rtx 4070的提升约为16%。对比rtx 4070 ti,相差5%左右。
下面我们再来看看3dmark中新增的一些具体应用场景的测试。
speed way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以sw的测试基本可以看做次世代3a游戏基准。
igame geforce rtx 4070 super ultra w oc对比rtx 4070,从1080p分辨率到4k提升依次为:17%/16%/17%。
而对比rtx 4070 ti的成绩几乎持平,差距不超过1%,整体来看,这张rtx 4070 super基本有着媲美rtx 4070 ti的性能。
另外我们使用3dmark刚刚更新的dlss 3进行了相关性能测试。
igame geforce rtx 4070 super ultra w oc在2k分辨率下dlss开关相比rtx 4070的提升为14%/20%;4k分辨率,提升约为15%/22%。
从整体的理论测试成绩来看,传统的fs/ts/pr三项测试,nvidia geforce rtx 4070 super相比rtx 4070综合提升约为17%左右;相比rtx 4070 ti的差距在5%左右,而最新的sw综合测试也基本呈现相同的结果。
5 常规游戏 性能测试
由于本次rtx 40系加入了dlss 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3a大作进行游戏性能对比。
在《极限竞速:地平线5》中,其中igame geforce rtx 4070 super ultra w oc相比rtx 4070提升明显,达到12%,2k分辨率提升14%;4k分辨率提升17%,综合提升14%。
在《刺客信条:幻景》中,igame geforce rtx 4070 super ultra w oc相比rtx 4070的提升分别为:1080p提升8%;2k提升9%;4k提升12%,综合提升10%。
在《无主之地3》中,igame geforce rtx 4070 super ultra w oc相比rtx 4070的提升分别为:1080p提升19%;2k提升16%;4k分辨率提升14%,综合提升16%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“rtx最高/dlss质量”。
性能方面,igame geforce rtx 4070 super ultra w oc相比rtx 4070的提升分别为:1080p提升18%;2k提升22%;4k提升23%,综合提升21%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“rtx最高/dlss质量”下进行。
在《边境》中,igame geforce rtx 4070 super ultra w oc相比rtx 4070的提升分别为:1080p提升17%;2k提升16%;4k提升19%,综合提升18%。
在“游戏测试标杆”的《赛博朋克2077》中,igame geforce rtx 4070 super ultra w oc在超级画质下,4k分辨率流畅运行是完全没有问题的;在光追超级画质下2k流畅运行同样没有问题;而作为次世代光追体验的超速模式中,1080p分辨率下同样可以达到70帧。
可能有玩家会觉得1080p只有70帧能算好?要知道在光追超速模式中,光线追踪加入了全新的路径追踪,它意味着游戏中会实时计算大量的光线路径,模拟更加真实的光照效果,被誉为光线追踪的“完全体”。
最后的测试中我们在《赛博朋克2077》体会一下不同的光影模式。
从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
另外《赛博朋克2077》更新了dlss 3.5,支持光线重建技术。在上面的测试图中不难发现,在关闭rtx以及dlss时,地面上的水渍基本不可视,完全无法看到反射情况。而开启rtx开启dlss 3.5的情况下,反射的字体轮廓更为清晰,大厦灯光也更清晰,基本与反射物体本身一模一样。
6 dlss 3性能测试
截止目前,超过 530 款游戏和应用已支持 rtx 技术。
其中《龙之信条 2》、《灰区战争》、《半条命 2》rtx 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《pax dei》、《星际矿工》和《王权与自由》均将支持 dlss 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 dlss 3 的支持,为配备 geforce rtx 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。
本次dlss 3增加了1% low fps和延迟的测试,1% low fps则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。
《星空》经历了首发后的低迷和差评,近期反响还不错,在1.8.86大版本更新后,加入了dlss 3,这也让手持n卡的用户终于不用再开启fsr了,整体来看效果非常好。
其中1080p分辨率下dlss 3相比dlss 2提升达到62%;2k分辨率提升51%;4k分辨率提升42%。不难看出在越低的分辨率,也就是cpu瓶颈下,dlss 3的帧生成加成越大。
虽然目前《星空》饱受批评的频繁读图依然没有修改,但至少使用n卡的用户,画面流畅度能够大幅提升了。
《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在igame geforce rtx 4070 super ultra w oc也有较明显的体现。在3种分辨率中,开启dlss 3相比dlss 2的提升分别为38%/27%/9%。
最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升,几乎达到了不开dlss无法流畅游戏的地步。其中igame geforce rtx 4070 super ultra w oc开启dlss 3相比关闭dlss,提升达到了127%;相比dlss 2的提升也达到了54%。
7 生产力工具测试
v-ray
在生产力工具上,我们测试了最新版本的v-ray渲染器,选择使用gpu渲染的cuda测试和rtx测试,成绩如图。
blender
blender是一款专业的三维渲染软件,目前推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。软件会自动渲染测试monster/junkshop/classroom共三个场景。
上图为igame geforce rtx 4070 super ultra w oc显卡得分,分别为3281/1548/1645分,平均2158分。
d5渲染器
d5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括sketchup、3ds max、rhino、revit、archicad、blender、c4d等。目前也已经支持dlss 3,下面我们分别看看帧数和功耗的情况。
选择软件自带的默认场景【简约客厅】
在实时帧数表现上,由于d5采用实时gpu渲染,所以压力全在显卡。可以看到在4k分辨率下,即便是igame geforce rtx 4070 super ultra w oc是ppt的状态,而开启dlss 3后,帧数提升可达到470%左右,非常暴力。
功耗方面,igame geforce rtx 4070 super ultra w oc的tdp为220w。关闭dlss的情况下,实际平均使用功耗为205w,而在开启dlss 3后,功耗仅有172w。更低的功耗,更高的帧数,可以说dlss 3不仅对于游戏玩家有非常大的帮助,对于内容创作者来说,也是1 1>2的效果。
8 aigc测试
ai时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式ai。此前我们已经测试过stable diffusion的ai绘图能力,不过目前nvidia推出了全新的tensorrt插件,可以充分调用tensor算力,下面我们来测试一下igame geforce rtx 4070 super ultra w oc在这方面的性能表现。
【注:所有测试默认开启xformers优化方案】
首先是较为基础的sd1.5模型测试,在sd1.5中模型的输出分辨率为512×512和768×768。我们将导出【trt】引擎,并记录使用默认模型渲染,以及【trt】模型渲染的批次时间。
根据nvidia提供的统一参数进行输出,以便记录结果。其中采样方式为:euler a;采样步骤:50;batch count:10
【默认sd1.5模型】igame geforce rtx 4070 super ultra w oc 运算时间 41.3s 约合 4.13秒一张图
【trt sd1.5模型】igame geforce rtx 4070 super ultra w oc 运算时间 31.5s 约合 3.15秒一张图
第二次测试为的sdxl模型测试,sdxl模型将在1024×1024分辨率进行训练,相比sd1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,sdxl模型的计算强度明显更高。
我们按照相同的参数进行设置,但尺寸规定为1024×1024,下面看看igame geforce rtx 4070 super ultra w oc的表现如何。
【默认sdxl模型】igame geforce rtx 4070 super ultra w oc 运算时间 2m49.7s 约合 16.97秒一张图
【trt sdxl模型】igame geforce rtx 4070 super ultra w oc 运算时间 1m47.7s 约合 10.77秒一张图
在更复杂的模型中,tensorrt引擎的优势愈发明显,单张图片的出图速度能够提高6秒左右。并且显存利用达到了100%,跑满12gb显存。
生成式ai在2023年初露端倪,2024年将迎来彻底爆发,虽然帮助最大的依然是内容创作者,但对于普通用户来说,他也可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。
目前生成式ai也仅在初步发展阶段,后续对于个性化教育、医疗保健、语言处理,甚至金融分析等等场景,相信都有ai的用武之地。
9 rtx 视频超分辨率(rtx video super resolution)测试
目前rtx 视频超分辨率(rtx video super resolution)已经在部分浏览器中进行测试,首先玩家需要更新到nvidia最新驱动,在nvidia控制面板中的【调整视频图像设置】可以看到最新的rtx 视频增强超分辨率。
rtx 视频超分辨率是 ai 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启rtx 视频超分辨率不仅需要最新版驱动,还需要使用rtx 40或30系列gpu,并且几乎适用于google chrome和microsoft edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开youtube或者b站,都可以享受到rtx vsr效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到gpu负载增加,即为开启成功。
我们打开youtube随意观看视频,在打开rtx vsr后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
(点击放大查看原图)
在下面这幅图的对比中,可以明显看到开启rtx 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。
不过需要注意的是,rtx 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2k以上,则基本很难看出区别。
这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。
10 温度及功耗测试
功耗测试中,我们选择furmark软件进行拷机测试,并采用gpu-z检测温度,功耗仅计算显卡自身。
可以看到igame geforce rtx 4070 super ultra w oc这张显卡但通过40分钟左右的拷机测试,温度在64℃左右,热点温度在76℃左右。
游戏动态功耗测试
本次我们在拷机测试中最大板载功耗为220w左右。不过由于不同游戏负载不同,gpu的实际功耗是动态变化的,类似于fps随时间的变化,rtx 40系列很难触及功耗墙。
igame geforce rtx 4070 super ultra w oc 3a游戏平均功耗
rtx 3070 ti 3a游戏平均功耗
在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、dlss质量、2k分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。
可以看到igame geforce rtx 4070 super ultra w oc平均功耗为210w,而rtx 3070 ti甚至达到了288w,低了78w。
游戏平均210w的功耗,对于长时间使用电脑的用户来说,确实能够有效降低电费,尤其是在南方,这种电费奇高的地区。同时对比上一代同级别产品有大幅下降,可以说rtx 40系显卡拥有更低功耗和更高的性能。
另外在一些相对极端的使用环境中,如网咖,电脑基本都是24小时满载运转。rtx 40系的超低功耗,对于网咖老板确实是极大地利好消息。
11 4070的价格4070 ti的性能
通篇测试下来,相信大家已经对igame geforce rtx 4070 super ultra w oc性能有了大概的掌握。可以说本次super系列依然是加量不加价,这一点与rtx 20系非常相似。
而截止目前发布的产品,这张rtx 4070 super可以完全取代rtx 4070,甚至rtx 4070 ti也被一并拉下马。
相比上一代卡皇rtx 3090,这张rtx 4070 super也不遑多让,基本相同的性能,功耗却只有rtx 3090的一半。
如果我们抛开70、80这种系列观念,它与rtx 30系的rtx 3080,甚至能够争一争“性价比之王”的桂冠。
综合性能方面,这张rtx 4070 super相比rtx 4070提升在15-20%左右,与rtx 4070 ti的差距在5%左右。作为一张70级别产品,虽然它定位2k分辨率的高帧光追游戏,但不管是日常网游、独立游戏,或是传统3a游戏,在4k分辨率下都能够达到流畅甚至电竞级水准,这次的super系列当真可喜可贺。
此前我们说过,从rtx 4090的性能来看,整体rtx 40系的性能提升其实相当炸裂,但从整个70级别开始,性能断档严重,这也导致了60级产品难以和rtx 30系拉开差距,而让人诟病。
此番super系列的升级,可以说将rtx 40系整体的性能水平,拉回到了正常区间,形成一个较为规则的等差数列。
以目前rtx 40系发布的这些显卡来说,rtx 4070 super是堪称完美平衡的一款显卡,不仅在3a游戏玩家中,又多了一个2k高性能游戏体验的显卡,对于内容创作,rtx 4070 super也同样得心应手。
它搭配了12gb显存,拥有568 tops ai算力,尤其在搭配了tensrort插件后,sdxl这种大模型的单张图片,较原先生成速度快了38%左右。批量处理多张的速度提升更是按照分钟来算的。
当然图片只是生成式ai的基础玩法,相信未来不管是语音、视频还是复杂场景的集合体——游戏,都离不开生成式ai,而对于ai领域,这张rtx 4070 super可以看做一张“门票”,并且是极具性价比的选择。所以一张高投资高回报的显卡还是十分划算的。
本次测试的igame ultra family全家桶延续了igame ultra系列的波普风,包括机箱、散热风扇、水冷散热器、主板、内存、电源,整机各类硬件相互呼应,视觉效果拉满,以极强的个性语言展示给玩家。对于喜欢潮流艺术,或者厌倦了素色搭配的玩家,不妨考虑这样一套igame ultra family。
目前,igame geforce rtx 4070 super ultra w oc 12gb已在七彩虹米乐体育官方下载官网商城及京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道同步开售。除了本次评测款,七彩虹还同时准备了igame vulcan、neptune、advanced及战斧、colorfire meow等多个不同系列的geforce rtx 4070 super显卡供玩家选购,售价4899元起。
让产品好玩点,让结果直接点,【有料评测】只做你最关心的评测内容!
评论