8099元是你的菜吗!NVIDIA RTX 4080 SUPER首发评测:能效比2倍于RTX 3090 Ti
一、前言:最后一块GeForce RTX 40 SUPER系列显卡
两倍于RTX 3090 Ti的能效比,性能还强了20%,载温度仅有60度,还支持完整的DLSS 3.5……
也许你曾经对RTX 4080心动不已,但是面对它9499元起步的售价只能望而却步。
现在你可以圆梦了!
2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。
此前RTX 4070 SUPER、RTX 4070 Ti SUPER已先后上市,现在终于轮到了RTX 4080 SUPER,这也是GeForce RTX 40 SUPER系列版图中的最后一块。
RTX 4080 SUPER采用了完全的、没有任何精简的AD103-400核心,共有7组GPC、14组TPC、80组SM单元,一组SM包含128个CUDA核心,共计10240个流处理器。
另外,它还有320个第四代Tensor张量核心、80个第三代RT光追核心、320个纹理单元、112个ROP单元以及64MB二级缓存。
显存依旧是256Bit位宽,但是频率从22.4GHz略微提升到了23GHz,对应的显存带宽从716GB/s提升到了736GB/s,提升幅度为2.6%。
RTX 4080 SUPER的详细规格参数如下:
如果对比RTX 3080 Ti,你会发现二者的核心规格非常相似,它们的流处理器、ROP、纹理单元、RT Core、Tensor Core的数量都是完全相同的。
不过由于升级到了Ada Lovelace架构,以及第四代Tensor张量核心以及第三代RT光追核心,RTX 4080 SUPER的DLSS和光追效率会更加优秀一些,能效也更高。
在价格方面,RTX 4080首发售价9499元起,而现在RTX 4080 SUPER只要8099元起,整整便宜了1400元。
二、图赏:与RTX 4080差不多 核心供电略有缩水
包装盒和RTX 4080公版差不多,区别在于原来是白字,现在改成了黑色字体。
开箱。
RTX 4080 SUPER整体是深灰黑色,比RTX 4080要黑一些。
正面。
背面。
3.5插槽厚度,16Pin供电接口在顶部中间。
3个DP1.4和1个HDMI 2.1接口。
和RTX 4090几乎相同的散热器,大面积的均热板,6条8mm复合热管,镇压RTX 4080 SUPER这样的显卡,给人牛刀杀鸡的感觉。
非常迷你的PCB板,10+3相供电电路设计,另外还有大量的空焊位。
左边是RTX 4080,右边是RTX 4080 SUPER,想不到供电还缩水了,从13+3相缩到了10+3相。
当然这也从另一个方面说明,RTX 4080 SUPER对供电的需求没那么高,Ada Lovelace架构的能效确实技高一筹。
RTX 4080 SUPER采用的是满血的AD103-400-A1核心,芯片面积378mm2,拥有459亿晶体管。
GPU旁边是8颗美光GDDR6X显存,单颗2GB,总容量16GB,等效频率23GHz,带宽736GB/s。
三、理论性能测试:最高运行频率2790MHz、风扇转速最高不到1400RPM
测试平台配置如下:
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4080 SUPER图形分数达到了33387分,核心温度最高60℃,热点温度最高70℃,核心运行最高频率为2775MHz,最高风扇转速1221PM,整卡最高功耗276W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4080 SUPER图形分数达到了17379分,核心温度最高56℃,核心运行最高频率为2790MHz,最高风扇转速1397RPM,最高功耗318W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 4080 SUPER图形分数达到了28573分,核心温度最高57℃,核心运行最高频率为2790Hz,最高风扇转速1272RPM,最高功耗319W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 4080 SUPER图形分数达到了14321分,核心温度最高58℃,核心运行最高频率为2790Hz,最高风扇转速1390RPM,最高功耗317W。
RTX 4080 SUPER的理论性能对比RTX 3090 Ti高了大约25-30%,如果对比RTX 4080则只只高了1-3%。
四、1080P游戏性能测试:略强于RTX 4080
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试数据汇总如下:
1080p分辨率对于RTX 4080 SUPER这样的显卡已经有点屈才了,我们还是测试了一下供参考,对比RTX 3090 Ti高了足足19%,但是和RTX 4080差别非常小,平均仅1%,《战争机器5》表现最好也不过4%。
五、2K分辨率游戏性能测试:比RTX 3090 Ti强22%
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试数据汇总如下
2K分辨率下,除了《星空》之外,RTX 4080 SUPER都跑出了超过140FPS的帧率。
和RTX 4080相比,稍微领先2%,但是和RTX 3090 Ti比起来,领先幅度达到了22%。
六、4K分辨率游戏性能测试:所有3A大作都能流畅运行
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试数据汇总如下:
在4K分辨率最高画质下,即便在没有开DLSS的情况下,RTX 4080 SUPER也能在所有游戏中跑出超过60FPS的帧率。
与RTX 4080相比,依然只有2%的优势,比起RTX 3090 Ti则能领先18%,比RTX 3080 Ti则强了31%。
七、StableDiffusion体验:SDXL可将生图速度提升270%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能让具备Tensor单元的GeForce显卡在Stable Diffusion Web UI 中获得翻倍的性能。
本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。
我们生成20张太空大战图像,分辨率1024*1024,使用PyTorch xFormers加速时,耗时8分钟。
使用SDXL加速之后,耗时仅为2分59秒。
结合终端数据,可以看到RTX 4080 SUPER使用默认加速器时,生图速度只有2.45t/s,而在TensorRT加持下,生图速度直接到了9.15it/s,提升幅度为270%。
八、DLSS3游戏测试之一:4款DLSS3游戏
此次我们一共测试了8款游戏,包括4款支持DLSS3的游戏:《3DMark》、《毁灭全人类》、《星空》、《微软模拟飞行》。
另外还有4款同时支持DLSS与光追的游戏:《光明记忆》、《生死轮回》、《赛博朋克2077》、《霍格沃茨之遗》。
所有DLSS3以及光追测试都是在4K分辨率下进行。
1、3DMark
DLSS 2模式下帧率为104FPS,比默认的41FPS提升了154%。
DLSS 3的成绩为172FPS,相比默认提升了142%。
2、星空
最高画质下,RTX 4080 SUPER帧率65FPS。
开启DLSS 3之后,帧率为137FPS,提升幅度为111%。
3、微软模拟飞行
4K分辨率最高画质下,RTX 4080 SUPER的帧率为78FPS。
开启DLSS 3之后,帧率达到了187,提升140%。
4、毁灭全人类2:重新探测
最高画质下,RTX 4080 SUPER的帧率为93FPS。
开启DLSS 3之后,帧率来到了180FPS,近乎翻倍。
九、DLSS3游戏测试之二:4款支持DLSS3的光追游戏
1、光明记忆:无限
开启光追时,游戏的帧率为76FPS。
开启DLSS 3之后,帧率提升到了168FPS,提升了121%。
2、生死轮回
开启光追之后,游戏的帧率仅有46FPS。
打开DLSS 3之后,帧率提升到了142FPS,提升幅度为209%。
3、赛博朋克2077
开启光追时,帧率为28FPS。
这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了114FPS,提升超过300%。
4、霍格沃茨之遗
开启光追时,帧率为43FPS。
打开DLSS 3之后,帧率来到了138FPS,提升幅度高达221%。
测试数据汇总如下:
RTX 4080 SUPER上开启光追后,平均性能损失幅度为54%,相比于RTX 3090 Ti减轻了一些。
再开启DLSS 2之后,平均性能提升121%,最高达到了186%。
DLSS 3效果更好,平均提升幅度高达179%,最高更是超过了300%,还是来自《赛博朋克2077》。
十、实际功耗测试:4K游戏平均功耗274W 能效比2倍与RTX 3090 Ti
1、烤机测试
室温19度,使用Furmark烤机5分钟,GPU功耗稳定在320W,核心频率2220MHz,温度65度,风扇转速1550RPM。
2)、真实游戏功耗测试
1、GTAV
1080P分辨率下,RTX 4080 SUPER的功耗为竟然只有70W,温度更是只有37度。
RTX 3090 Ti则高达218W,温度也有60度。
2K分辨率下,RTX 4080 SUPER功耗是134W,运行频率2760MHz,温度43度。
RTX 3090 Ti的功耗为277W,运行频率2040MHz,温度50度。
到了4K分辨率,RTX 4080 SUPER的功耗是231W,而RTX 3090 Ti功耗为378W。
2、绝地求生
1080P分辨率下,RTX 4080 SUPER的功耗为231W,而RTX 3090 Ti则高达394W。
2K分辨率下,RTX 4080 SUPER功耗是230W,运行频率2730MHz,温度61度。
RTX 3090 Ti的功耗为404W,运行频率2010MHz,温度86度。
到了4K分辨率,RTX 4080 SUPER的功耗是257W,而RTX 3090 Ti功耗为433W。
3、古墓丽影:暗影
1080P分辨率下,RTX 4080 SUPER的功耗为233W,而RTX 3090 Ti则高达374W。
2K分辨率下,RTX 4080 SUPER功耗是252W,运行频率2745MHz,温度60度。
RTX 3090 Ti的功耗为400W,运行频率20250MHz,温度65度。
到了4K分辨率,RTX 4080 SUPER的功耗是273W,而RTX 3090 Ti功耗为432W。
测试数据汇总如下:
RTX 4080 SUPER在1080P、2K与4K分辨率下的游戏功耗分别为205W、240W、274W,大约是RTX 3090 Ti的60%。
考虑到RTX 4080 SUPER的性能要强了20%左右,换算下来它的能效比超过了RTX 3090 Ti的2倍。
十一、总结:能效与散热表现优秀 8099元会是你的菜吗!
本次测试小结如下:
1、性能
流处理器从9728个提升到10240,增幅近6%;Boost频率从2505MHz拉到到2550MHz,也有2%的提升,料想性能应该能比RTX 4080强5%左右,但实际2%的提升幅度比起预期还是低了那么一些。
考虑到320W的TGP已经非常富余了,那么性能提升的瓶颈就只有显存。我们稍微做了超频测试,将显存频率从23GHz超频到23.7GHz,部分游戏就有2%左右的帧率提升。
在1080P分辨率下,RTX 4080比RTX 3090 Ti强了18%,比RTX 4080强了1%,比起RTX 3080 Ti则是强了26%之多。
2K分辨率下,RTX 4080 SUPER相比RTX 3090 Ti领先优势扩大到了22%,比RTX 4080快了2%,比起RTX 3080 Ti则有32%的优势。
4K分辨率下,RTX 4080 SUPER依旧能够领先RTX 3090 Ti约18%的样子,比RTX 4080快了2%,比RTX 3080 Ti快了31%。
2、能效比2倍于RTX 3090 Ti
RTX 4080 SUPER的游戏功耗大约是RTX 3090 Ti的60%,考虑到它的游戏性能要强了20%左右,因此可以得知RTX 4080 SUPER的拥有RTX 3090 Ti两倍的能效比
有一点值得注意,在1080P分辨率下,RTX 4080 SUPER在多数游戏中的功耗都与RTX 4070 Ti SUPER相当甚至更低,比如在《GTA V》中,RTX 4080 SUPER的功耗竟然只有76瓦,而RTX 3090 Ti则高达216W,RTX 4070 Ti SUPER也超过了100W。
在我们所测试的6款游戏中,在1080P分辨率下RTX 4080 SUPER的平均功耗是205W,而RTX 3080 Ti是314W,RTX 3090 Ti则是356W。
2K分辨率下,RTX 4080 SUPER在6款游戏中的平均功耗是240W,RTX 3080 Ti和RTX 3090 Ti则分别是332W、390W。
4K分辨率下,RTX 4080 SUPER在6款游戏中的平均功耗为274W,没有一款游戏的功耗超过300W,更别说触碰320W的功耗墙。而RTX 3080 Ti已经跑到了350W的TGP上限,RTX 3090 Ti则高达428W。
3、DLSS 3和光追
目前可玩的DLSS 3游戏已有60余款,此次我们测试了8款。
在开启DLSS 2之后,游戏帧率提升幅度为121%。打开DLSS 3,游戏帧率提升幅度达到了179%。
在开启光追和DLSS 3时,RTX 4080 SUPER的平均帧率高出RTX 3090 Ti 50%以上,像《赛博朋克2077》这样的显卡杀手,领先优势则达到了70%。
4、AI性能
毫无疑问,RTX 40系显卡是Stable Diffusion画图首选,特别是在使用TensorRT加速时,RTX 4080 SUPER的生图性能直接从2.45it/s猛增到了9.15it/s,提升幅度超过270%。
5、散热
就公版而言,拿RTX 4090的散热套在RTX 4080 SUPER上真的有点大材小用,实测烤机半小时,GPU温度只有65度,并不输给顶级非公。
在正常游戏中,RTX 4080 SUPER的实际功耗远没有达到320W的TGP功耗墙,运行3A游戏时基本上都在50度上下,这和RTX 3080动辄80度简直就不可同日而语。
最后就是价格了,如果你买不起9499元的RTX 4080,那么现在8099元的RTX 4080 SUPER会是你的菜吗!